mask rcnn和roi-align

faster-rcnn的github源码中是round四舍五入

但kaiming he的ppt是直接取整

１．讲roi-align和roi-pooling区别并且详细阐述roi-align过程的博客：http://blog.leanote.com/post/afanti/b5f4f526490b，此博主还有另外一篇在rfcn中

使用roi-align的博客：http://blog.leanote.com/post/afanti/Position-Sensitive

2.具体讲解roi-align的计算方式，并且有整个网络的结构图，几个链接也有一些ｓｌｉｄｅ，这个博主的文章值得关注：http://blog.csdn.net/u013010889/article/details/78588227

3．Mask RCNN中的RoiAlign源码（caffe2）解读：　http://blog.csdn.net/yiyouxian/article/details/79221830

roi-align总结：对于每个roi，映射之后坐标保持浮点数，在此基础上再平均切分成k*k个bin，这个时候也保持浮点数。再把每个bin平均分成４个小的空间，然后计算每个小空间的中心点的像素点对应的概率值。这个像素点大概率是一个浮点数，实际上图像的浮点是没有像素值的，但这里假设这个浮点数的位置存储一个概率值，这个值由相邻最近的整数像素点存储的概率值经过双线性插值得到，其实也就是根据这个中心点所在的像素值找到所在的小空间对应的４个整数像素存储的值，然后乘以多个参数进行插值。这些参数其实就是那４个整数像素点和中心点的位置距离关系构成参数。最后再在每个bin中对４个中心点进行max或者mean的pooling。