[读书笔记] 两则之一: Smarter video searching and indexing 更为智能的视频搜索和索引技术

这个工作是来自于 Universit of Lincoln的博士生Saddam Bekhet的工作,很有意思的paper,简单有效,正好是我最喜欢的那种科研风格;

原文地址: http://www.lincoln.ac.uk/news/2013/10/779.asp

文中也是有paper 的title,在google scholar或者microsoft academic中搜索就可以检索到全文;

基本思路是,传统的视频检索呢,是基于文本的描述信息进行对应的;如果文本描述有误或者质量低下,那么使用基于文本的映射关系建立就不靠谱了;基于这个问题Saddam提出的方法(在我看来)就是抽取视频video当中的关键指纹信息来描述,那么如何辨别关键的frame的位置,并且将其抽取处理后如何表征为描述当前视频的核心元量?还是仔细读读该文章吧;宣称做到了 “suggests a framework towards real-time video matching”。

关键看这一段:

Saddam’s framework relies upon finding similarities between videos using tiny frames instead of using the full-size video frames. Such tiny frames are easily extracted from a compressed video in real-time and able to fully represent video content, without wasting more time in decompressing the video to perform complex computer algorithms.

抽取指纹帧,当然可以做到real-time了。。关键问题就是如何抽,从哪里抽,锚点怎么选定,总之就是tiny representative frames的选取了;记得本科时做垃圾邮件的特征抽取,当时就是选择一定步长进行盲抽,设法利用这样一个简单的方法试图达到不错的辨识效果,结果,很悲剧;然后心中一直“耿耿于怀”,今天想看看Saddam的做法;

待后续~~~~~~~

原文地址:https://www.cnblogs.com/superniaoren/p/3383168.html