CV-NeXtVLAD

1.运用场景

    用于短视频分类及视频特征提取。

2.创新点

    聚合视频帧级别图像特征;
    减少NetVLAD网络参数。

3.算法原理

3.1 网络框架

3.2 NeXtVLAD

    NeXtVLAD论文

4.算法理解

    NeXtVLAD与NetVLAD类似,也是一种图像特征编码,可以用于很好的提取视频帧级别的特征。其在NetVLAD的基础上,通过分组的思想来较少最后一层全连接层的参数,从而减少网络的计算复杂度。该网络可以视为视频处理领域的通过网络结构,可以很好的融合多种模态信息。

原文地址:https://www.cnblogs.com/LuckPsyduck/p/12605181.html