这篇论文提出的一些思想、说法很有趣,但是做法就比较普通了,可以作为备选的做法之一。

创新:

  • 将序列3D特征进行时间分解和空间分解,在时间上分解为静态特征动态特征,在空间上分解为全局和局部特征。
  • 采用计算Attention Mask的方式来实现

优缺点&改进利用

  • 采用Attention Mask方式来实现不同特征的过滤,但是缺乏针对性的设计以及监督,采用end-to-end的方式并无法保证能提取到这些特征。Attention Mask的实现方式倒是可以作为一种可行做法
  • 所有的特征都是 intuitional 的,刚好加上互信息监督