基于三维点云场景的语义及实例分割

 https://www.bilibili.com/video/BV1aE411T7Gf/?spm_id_from=333.788.recommend_more_video.15

 

 

 

 2D识别/j检测/分割的缺点:不知道检测出来的人离自己或者机器有多远。理想的情况是让机器感知到3D世界,并做一定的交互。

人能感知到3维世界,但是机器不行。

人看兔子是有3维形状的,但是机器只认为它是一连串的点。

3d点云的优点是含有几何信息。采集是数据不受光照的影响,这一点和Image是有区别的。

缺点或者说挑战:

1.不规则,近密远疏。不想image那样,按照pixel有规则的排列。

2. 无序。打乱后,还是表示同一个对象,但是计算机这时候认为不是一个对象了,因为点的矩阵不一样了。

 

 

 

 semantic segmentation是把一个场景中所有的椅子输出为一个标签,instance segmentation在所有椅子输出一个标签的基础上,还是把每一把椅子区分开,每一把椅子都要有不同的标签,是更加细粒度的语义识别,更加高层次的一个理解。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 目前3d点云的实例分割还没有Pipeline.

原文地址:https://www.cnblogs.com/yibeimingyue/p/14793219.html