计算机视觉的未来3-5年

从1966年到2016年，正好恰恰过去了五十年，过去的五十年计算机视觉发展非常快。今天计算机视觉是不是变成了很成熟、很完美的技术？并不是。

比如说，蓝天白云下，公路上有一辆白色的大卡车，计算机就可能说，这是一朵白云。大家可能都想到了这是一个惨剧：一辆特斯拉没有检测出的卡车，使得高速行驶的特斯拉司机当场死亡。

尽管计算机视觉技术并没有发展到成熟的阶段，但随着应用市场的打开，新的机会与技术革新将随之而来。

未来3-5年，计算机视觉领域将有三个变化值得关注

做为一个计算机视觉行业的从业者，讲讲我个人对未来三到五年的看法。

首先，计算机视觉有很多开源软件包，但是随着视觉的问题越来越复杂，以及我们对安全性的要求越来越高，复杂的问题一定要找专业的团队来解决。比如解决摄像机运动轨迹的问题，你如果拿一个手机从一个房间走到另外一个房间，再回到原来的位置，生成了一条轨迹。把这个数据给Orb slam去分析，它所得出的轨迹就有所变化，而且和墙壁有很大的重叠。如果有一个机器人使用了这个Orb slam项目，出门的时候会撞到墙。

即使现在有许多开源的项目，但商用化的计算机视觉系统能在不同的平台和不同的使用环境下反复测试对比，最终可以实现平均性能更加优越，并且没有重大安全隐患。复杂的问题与应用，一定要找专业的团队去解决。这个领域会出现超过十亿台下一代测算平台，新一代的智能手机，还有无人机。与这对应的技术有数百亿的市场，计算机视觉领域将诞生出很多上市企业。

第二个关注的变化是芯片化。我们知道计算机视觉往往需要非常复杂的算法去解决，应用往往都是移动化的，例如移动化的设备，移动的机器人。在移动化的设备里面，要以低能耗的方式进行复杂的算法，芯片一定是必经之路。现在行业里面，大量团队在进行算法的研发，一些走的比较快的同行已经开始将成熟的算法芯片化了。这样，除了算法的优越程度以外，肯定还存在芯片的功耗与成本问题。

第三个关注的变化是理论上的，即深度学习之后会产生什么样的数学模型。深度学习的缺点也是人尽皆知，它需要进行海量的资料的学习。曾经有这个领域的权威Davis Marr，在生前预言说，计算机是复杂的问题，最后会有单一理论框架使之得到解决。

深度学习不会是这种终极框架，还将有更强大的数学模型出现。它对人类影响也会是更深远的，我们应该深刻关注理论上的变化，把最新的技术做成产品来解决实际的问题。

本文首发钛媒体，由张霖根据包英泽在2016MIIC大会上的演讲整理