北大教授陈宝权：AI＋三维视觉，让机器人具备决策和执行力

　　人类不仅可以通过眼睛“看清”周围环境中的东西，还能“识别并理解”这些东西，对这些东西形成“认知和决策”。现在，研究人员正努力让AI也做到这一点。北京大学博雅特聘教授、前沿计算研究中心执行主任陈宝权的这篇精彩演讲，对当前国内三维视觉智能领域研究概况、技术应用方向和未来前景做了精彩分析。

　　众所周知，人工智能是模拟人类智能的技术，实现对人类智能的完全再现，是人工智能的终极目标。而人类智能是从人类的感官和认知开始的。所以，人类的感官往往成为研究人工智能的入手点，比如视觉。

　　对于人类而言，不仅可以通过眼睛“看清”周围环境中的东西，还能“识别并理解”这些东西，对这些东西形成“认知和决策”。现在，越来越多的AI领域的研究人员正努力让AI同样做到这一点。从人类的三维视觉出发，三维视觉智能已成为人工智能研究和应用的热门领域。

　　在今年3月27日新智元举办的“智能云·新世界”AI技术峰会上，北京大学博雅特聘教授、前沿计算研究中心执行主任陈宝权发表了题为《三维视觉智能及应用》的演讲，从研究人员的视角，对当前国内三维视觉智能领域研究概况、技术应用方向和未来前景做了精彩的分析。

　　以下为新智元整理的演讲内容：

　　北京大学博雅特聘教授、前沿计算研究中心执行主任陈宝权

　　今天很高兴有机会能够在这里发表演讲!今天下午的讲者主要来自于企业，我就从学术研究的角度，对现在非常流行的人工智能技术的重要分支——视觉智能来做下介绍。

　　说到视觉智能，大家都不陌生，人工智能的很多技术是基于人的各种感观的，其中视觉感观就是非常重要的一环。在视觉智能方面的很多技术已经在工业界得到非常好的应用。随着应用的深入，越来越多的视觉智能技术进入“三维视觉智能”阶段。也就是说，我们的眼睛不仅要看清某个东西，认识某个东西，还要走到这个场景里面去，在三维世界里真实地感受场景，如同身临其境。

　　这就需要具有三维空间感知与认知能力的智能，即三维视觉智能。任何一个新的研究方向的出现都不是凭空而来，而是和许多其他学科交叉而来的。三维视觉智能的研究就是集合计算机图形学、计算机视觉等领域的技术与传统的人工智能、学习、大数据等很好地交叉融合。

　　三维视觉技术的发展得益于视觉传感器的快速发展，已经在推动很多应用，比较有代表性的包括无人车、机器人，以及娱乐、影视等其它领域的应用。

　　三维视觉研究什么?总结起来有几大主要方向：郑州不孕不育医院排名:http://yiyuan.120ask.com/zzbyby/

　　首先是三维感知，也就是感知三维空间，获取和处理三维深度等;然后是位置感知，比如感知相机的位置等;第三是三维建模，不仅对场景有基本的深度感知，还要获得关于场景完整几何模型的描述。最重要的就是三维理解，对场景和其中的物体从三维空间来进行理解。

　　三维视觉的发展得益于视觉传感器的发展，而传感器大致可以分为两类，一类是被动传感器，现在我们用的各种相机就是被动传感器。另一类就是主动传感器，比如激光扫描，以及各类以主动发射信号为主导进行测量的传感器。大家知道，随着手机的快速发展，未来的手机会同时配备两类传感器，也就是深度传感器和传统的颜色传感器。

　　下面简要介绍一下我们在这方面的一些探索性工作。2009年，当时大疆无人机还做定制化产品，我们请大疆做了一台定制化无人机，目的用它来做倾斜角航拍，利用无人机从空中得到航拍影像，经过三维重建计算以后得到三维影像数据(注意，还不是完整的三维模型)，有了三维描述就可以从任意视角自由地漫游场景。可以看到，尽管用的只是二维传感器，依然可以通过视觉计算得到三维数据的描述。