201905_S-TPNET

201905_S-TPNET

论文标题：

来源/作者机构情况：

北京交通大学

解决问题/主要思想贡献：

使用特征金字塔
对时间采用时间不同粗细度来提取特征

成果/优点：

动作识别率有所提升

缺点：

感觉在搬其他人现有的方法

反思改进/灵感：

这个时间段划分的大小，能不能自动学习得到，而不是自己调整的

论文主要内容与关键点：

1.前沿
2相关工作
3.提出的模型
- spatial：网络初试参数来自Res_net34，为了可以Deep
- 对采样的图片，low层2828，mid层1414，high层7*7
- 采用global pooling,并且后面接1*1的Conv，为了改变CHANEL的数量
- temple：采用组集的采样，分为三种情况（每组两帧，三帧，四帧）然后在每一组使用max pooling。后面直接把各个组的情况concat。这样就得到三组大的特征组

时间的分组采样
时间不同组之间的样例
- 最后使用加权平均，把这些特征组变成混合特征，

4.讲了一些权值的设置，和数据集的介绍
5.实验
- 5.1 不同时间间隔的结果，会发现针对长时间的动作，粗的时间推理好；短时间动作，精细时间推理好！
- 5.2 later fusion比其他的特征融合会稍微好一些
- 5.3 有空间卷积，可以提升4%
- 5.4 目前sof的结果对比，作者的方法不是最好的，原因是硬件和图像的大小方面都有所牺牲
6.总结

代码实现：

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/captain-dl/p/10978226.html