软件杯-视频全量目标分析和建模需求分析说明

开发环境:

  1. 华为云 AI开发平台ModelArts

开发语言:

  1. python3.7

深度学习框架:

  1. TensorFlow1.x

数据集:

  1. 参考cityscapes-image-pairs等

预计初步实现:

简单来说 提取视频的帧 然后处理 在合成
我们感觉原视频和分割后的视频放一起比较好,但是抽帧分割再合成后的视频和原视频对不上
感觉视频分割方面还得改,但是还没想好咋弄?

提取每帧:

初步效果:

功能需求:利用视觉分析技术对高分辨率视频进行目标检测和语义分割

具体:

基本要求:
  1. 分类和定位。针对10分钟1080P视频内容进行移动目标识别(包括人、机动车、非机动车、建筑、植物等5种以上)
  2. 语义分割。实现对高清视频图像语义分割(对每帧的每个点的类别预测)
  3. 重点实现对建筑物等固定目标的识别和分割
进阶需求:
  1. 实现移动目标10种以上(其中建筑物必须识别)
  2. 实现实例分割
  3. 性能优化,创新深度学习算法模型

计算机视觉四大步骤:(分类、定位、检测、分割)

原文地址:https://www.cnblogs.com/zzstdruan1707-4/p/12804467.html