视觉SLAM十四讲课后习题

视觉SLAM十四讲课后习题—ch8

1.除了LK光流之外，还有哪些光流方法？它们各有什么特点？

　　参考：https://blog.csdn.net/on2way/article/details/48953975

1）LK(Lucas-Kanada)光流：一种经典的方法，基于局部特征计算光流
2）Horn-Schunck光流方法：全局性质下计算光流的方法，该方法运算较慢
3）Buxton方法：一种基于边缘运动的图像序列模型的方法
4）Black-Jepson方法

2.在本节程序的求图像梯度过程中，我们简单地求了u+1和u-1的灰度之差处以2，作为u方向上的梯度值。这种做法有什么缺点？提示：对于距离较近的特征，变化应该较快，而距离较远的特征在图像中变化较慢，求梯度时能否利用此信息？

　　本节程序中求图像梯度的过程：

　jacobian_pixel_uv(0,0)=(getPixelValue(u+1,v)-getPixelValue(u-1,v))/2;

　　　　　　　 jacobian_pixel_uv(0,1)=(getPixelValue(u,v+1)-getPixelValue(u,v-1))/2；

　　显然，当灰度值变化很快的时候，u方向上的梯度值是不能等于u+1处的梯度值和u-1处的梯度值之差除以2的。

3.在稀疏直接法中，假设单个像素周围小块的光度也不变，是否可以提高算法的健壮性，请编程实现。

　　分析：直接法是基于灰度不变假设，即同一个空间点的像素灰度值在各个图像中是固定不变的。如果现在假设单个像素周围小块的光度也不变，我们就可以用单个像素周围小块的平均灰度值来代替单个像素的灰度值。至于是否能提高健壮性，还需实验和评估。

　　类似的思想见ch13讲中的块匹配

　　在稀疏直接法实践（见《视觉SLAM十四讲》笔记（ch8）2.1实践）的基础上更改程序：

　　参考：https://www.cnblogs.com/newneul/p/8571653.html　　　　

  1 #include <iostream>
  2 #include <fstream>
  3 #include <list>
  4 #include <vector>
  5 #include <chrono>
  6 #include <ctime>
  7 #include <climits>
  8 
  9 #include <opencv2/core/core.hpp>
 10 #include <opencv2/imgproc/imgproc.hpp>
 11 #include <opencv2/highgui/highgui.hpp>
 12 #include <opencv2/features2d/features2d.hpp>
 13 
 14 #include <g2o/core/base_unary_edge.h>
 15 #include <g2o/core/block_solver.h>
 16 #include <g2o/core/optimization_algorithm_levenberg.h>
 17 #include <g2o/solvers/dense/linear_solver_dense.h>
 18 #include <g2o/core/robust_kernel.h>
 19 #include <g2o/types/sba/types_six_dof_expmap.h>
 20 
 21 using namespace std;
 22 using namespace g2o;
 23 
 24 int patchRadius=1;
 25 //获取小块平均灰度值
 26 // gray:灰度矩阵 x,y表示以(x,y)为中心
 27 //计算的小块的平均灰度
 28 float getPatchAverageGray(const cv::Mat &gray ,float u, float v);
 29 
 30 
 31 struct Measurement
 32 {
 33     Measurement ( Eigen::Vector3d p, float g ) : pos_world ( p ), grayscale ( g ) {}
 34     Eigen::Vector3d pos_world;
 35     float grayscale;
 36 };
 37 
 38 //转换成相机坐标系下坐标
 39 inline Eigen::Vector3d project2Dto3D ( int x, int y, int d, float fx, float fy, float cx, float cy, float scale )
 40 {
 41     float zz = float ( d ) /scale;
 42     float xx = zz* ( x-cx ) /fx;
 43     float yy = zz* ( y-cy ) /fy;
 44     return Eigen::Vector3d ( xx, yy, zz );
 45 }
 46 
 47 inline Eigen::Vector2d project3Dto2D ( float x, float y, float z, float fx, float fy, float cx, float cy )
 48 {
 49     float u = fx*x/z+cx;
 50     float v = fy*y/z+cy;
 51     return Eigen::Vector2d ( u,v );
 52 }
 53 
 54 // 直接法估计位姿
 55 // 输入：测量值（空间点的灰度），新的灰度图，相机内参；
 56 //输出：相机位姿
 57 void poseEstimationDirect ( const vector<Measurement>& measurements, cv::Mat* gray, Eigen::Matrix3f& intrinsics, Eigen::Isometry3d& Tcw );
 58 
 59 // project a 3d point into an image plane, the error is photometric error
 60 // an unary edge with one vertex SE3Expmap (the pose of camera)
 61                                             //误差值维度 误差类型 顶点类型
 62 class EdgeSE3ProjectDirect: public BaseUnaryEdge< 1, double, VertexSE3Expmap>
 63 {
 64 public:
 65     EIGEN_MAKE_ALIGNED_OPERATOR_NEW
 66 
 67     EdgeSE3ProjectDirect() = default; //代替下面的方式 默认产生合成的构造函数
 68     //EdgeSE3ProjectDirect(){}
 69     EdgeSE3ProjectDirect ( Eigen::Vector3d point, float fx, float fy, float cx, float cy, cv::Mat* image )
 70         : x_world_ ( point ), fx_ ( fx ), fy_ ( fy ), cx_ ( cx ), cy_ ( cy ), image_ ( image )      //灰度图像指针
 71     {}
 72 
 73     virtual void computeError()
 74     {
 75         const VertexSE3Expmap* v  =static_cast<const VertexSE3Expmap*> ( _vertices[0] );
 76         Eigen::Vector3d x_local = v->estimate().map ( x_world_ );
 77         float x = x_local[0]*fx_/x_local[2] + cx_;  //世界坐标转换到当期帧像素坐标
 78         float y = x_local[1]*fy_/x_local[2] + cy_;
 79         // check x,y is in the image
 80         //距离图像四条边4个像素大小的区域内作为有效投影区域 对于不在该范围内的点误差值设为0 为了防止计算的误差太大 拉低内点对误差的影响 导致估计的RT严重偏离真值
 81         if ( x-4<0 || ( x+4 ) >image_->cols || ( y-4 ) <0 || ( y+4 ) >image_->rows )
 82         {
 83             _error ( 0,0 ) = 0.0;
 84             this->setLevel ( 1 );
 85         }
 86         else
 87         {
 88             float sumValue = 0.0;
 89             for(int i = x-1; i<=x+1 ; ++i)
 90                 for (int j = y-1; j <= y+1 ; ++j) {
 91                     sumValue += getPixelValue(i,j);
 92                 }
 93             //sumValue /=( (2*PATCH_RADIUS +1)*(2*PATCH_RADIUS+1) );  //求得元素周围小块的平均灰度值
 94        sumValue/=9;
 95             _error (0,0) = sumValue - _measurement;
 96         }
 97     }
 98 
 99     // plus in manifold
100     //提供误差关于位姿的雅克比矩阵 书上8.16式子 只不过负号去掉了 因为用的是当前帧灰度值 - 世界坐标下的测量值
101     virtual void linearizeOplus( )override
102     {
103         if ( level() == 1 )
104         {
105             _jacobianOplusXi = Eigen::Matrix<double, 1, 6>::Zero();
106             return;
107         }
108         VertexSE3Expmap* vtx = dynamic_cast<VertexSE3Expmap*> ( _vertices[0] );
109         Eigen::Vector3d xyz_trans = vtx->estimate().map ( x_world_ );   // q in book 转换到第二帧坐标系下
110 
111         double x = xyz_trans[0];
112         double y = xyz_trans[1];
113         double invz = 1.0/xyz_trans[2];
114         double invz_2 = invz*invz;
115 
116         float u = x*fx_*invz + cx_;//投影到第二帧像素坐标系
117         float v = y*fy_*invz + cy_;
118 
119         // jacobian from se3 to u,v
120         // NOTE that in g2o the Lie algebra is (omega, epsilon), where omega is so(3) and epsilon the translation
121         Eigen::Matrix<double, 2, 6> jacobian_uv_ksai;
122 
123         //书上8.15式子
124         jacobian_uv_ksai ( 0,0 ) = - x*y*invz_2 *fx_;
125         jacobian_uv_ksai ( 0,1 ) = ( 1+ ( x*x*invz_2 ) ) *fx_;
126         jacobian_uv_ksai ( 0,2 ) = - y*invz *fx_;
127         jacobian_uv_ksai ( 0,3 ) = invz *fx_;
128         jacobian_uv_ksai ( 0,4 ) = 0;
129         jacobian_uv_ksai ( 0,5 ) = -x*invz_2 *fx_;
130 
131         jacobian_uv_ksai ( 1,0 ) = - ( 1+y*y*invz_2 ) *fy_;
132         jacobian_uv_ksai ( 1,1 ) = x*y*invz_2 *fy_;
133         jacobian_uv_ksai ( 1,2 ) = x*invz *fy_;
134         jacobian_uv_ksai ( 1,3 ) = 0;
135         jacobian_uv_ksai ( 1,4 ) = invz *fy_;
136         jacobian_uv_ksai ( 1,5 ) = -y*invz_2 *fy_;
137 
138         Eigen::Matrix<double, 1, 2> jacobian_pixel_uv;
139 
140         //书上I2对像素坐标系的偏导数  这里很有可能 计算出来的梯度为0  因为FAST角点的梯度没有限制
141         //这也是半稠密法主要改进的地方 就是选关键点的时候 选择梯度大的点 因此这里的梯度就不可能为0了
142         jacobian_pixel_uv ( 0,0 ) = ( getPixelValue ( u+1,v )-getPixelValue ( u-1,v ) ) /2;
143         jacobian_pixel_uv ( 0,1 ) = ( getPixelValue ( u,v+1 )-getPixelValue ( u,v-1 ) ) /2;
144 
145         _jacobianOplusXi = jacobian_pixel_uv*jacobian_uv_ksai;//书上8.16式子
146     }
147 
148     // dummy read and write functions because we don't care...
149     virtual bool read ( std::istream& in ) {}
150     virtual bool write ( std::ostream& out ) const {}
151 
152 protected:
153     // get a gray scale value from reference image (bilinear interpolated)
154     //下面的方式 针对单通道的灰度图
155     inline float getPixelValue ( float x, float y )//通过双线性插值获取浮点坐标对应的插值后的像素值
156     {
157         uchar* data = & image_->data[ int ( y ) * image_->step + int ( x ) ];//step表示图像矩阵一行的所有字节（包括所有通道的总和），data表示存储图像的开始指针
158         float xx = x - floor ( x );     //取整函数
159         float yy = y - floor ( y );
160         return float (  //公式f(i+u,j+v) = (1-u)(1-v)f(i,j) + u(1-v)f(i+1,j) + (1-u)vf(i,j+1) + uvf(i+1,j+1)
161                         //这里的xx 就是u  yy就是v
162                    ( 1-xx ) * ( 1-yy ) * data[0] +
163                    xx* ( 1-yy ) * data[1] +
164                    ( 1-xx ) *yy*data[ image_->step ] +  //I(i+1,j) //这里相当于像素的周期是image_->step，即每一行存储像素的个数为image_->step
165                    xx*yy*data[image_->step+1]  //I(i+1,j+1)        //data[image_->step]是I(i,j)对应的下一行像素为I(i+1,j)
166                );
167     }
168 public:
169     Eigen::Vector3d x_world_;   // 3D point in world frame
170     float cx_=0, cy_=0, fx_=0, fy_=0; // Camera intrinsics
171     cv::Mat* image_=nullptr;    // reference image
172 };
173 
174 int main ( int argc, char** argv )
175 {
176     if ( argc != 2 )
177     {
178         cout<<"usage: useLK path_to_dataset"<<endl;
179         return 1;
180     }
181     srand ( ( unsigned int ) time ( 0 ) );
182     string path_to_dataset = argv[1];
183     string associate_file = path_to_dataset + "/associate.txt";
184 
185     ifstream fin ( associate_file );
186 
187     string rgb_file, depth_file, time_rgb, time_depth;
188     cv::Mat color, depth, gray;
189     vector<Measurement> measurements;//Measurement类 存储世界坐标点（以第一帧为参考的FAST关键点） 和 对应的灰度图像（由color->gray）的灰度值
190     // 相机内参
191     float cx = 325.5;
192     float cy = 253.5;
193     float fx = 518.0;
194     float fy = 519.0;
195     float depth_scale = 1000.0;
196     Eigen::Matrix3f K;
197     K<<fx,0.f,cx,0.f,fy,cy,0.f,0.f,1.0f;
198 
199     Eigen::Isometry3d Tcw = Eigen::Isometry3d::Identity();//三维变换矩阵T 4X4 初始时刻是单位R矩阵+0平移向量
200 
201     cv::Mat prev_color;
202     // 我们以第一个图像为参考，对后续图像和参考图像做直接法 ，每一副图像 都会与第一帧图像做直接法计算第一帧到当前帧的RT 但是经过更多的帧后 关键点的数量会减少，
203     //所以实际应用时 应当规定关键点的数量少于多少 就该从新设定参考系，再次利用直接法 ，但是会累计的误差需要解决？？？？
204     for ( int index=0; index<10; index++ )//总共10帧
205     {
206         cout<<"*********** loop "<<index<<" ************"<<endl;
207         fin>>time_rgb>>rgb_file>>time_depth>>depth_file;
208         color = cv::imread ( path_to_dataset+"/"+rgb_file );
209         depth = cv::imread ( path_to_dataset+"/"+depth_file, -1 );//-1 按原图像的方式存储 detph 16位存储
210         if ( color.data==nullptr || depth.data==nullptr )
211             continue;
212         //转换后的灰度图为g2o优化需要的边提供灰度值
213         cv::cvtColor ( color, gray, cv::COLOR_BGR2GRAY );   //将颜色图3通道 转换为灰度图单通道 8位无符号 对应边类的双线性插值计算放法以单通道计算的
214 
215         //第一帧为世界坐标系 计算FAST关键点 为之后与当前帧用直接法计算RT做准备
216         if ( index ==0 )//以第一帧为参考系 计算关键点后存储测量值（关键点对应的灰度值） 以此为基准跟踪后面的图像 计算位姿
217         {
218             // 对第一帧提取FAST特征点
219             vector<cv::KeyPoint> keypoints;
220             cv::Ptr<cv::FastFeatureDetector> detector = cv::FastFeatureDetector::create();
221             detector->detect ( color, keypoints );
222             //对于2D关键点获取 3D信息 并去掉范围外的点 存储符合要求的关键点的深度值和3D信息
223             //对所有关键点挑选出符合要求且有深度值的 存储到vector<Measurement> measurements中 为g2o边提供灰度测量值和空间点坐标
224             for ( auto kp:keypoints )
225             {
226                 // 去掉邻近边缘处的点 在离图像四条边20个像素构成的内矩阵范围内是符合要求的关键点
227                 if ( kp.pt.x < 20 || kp.pt.y < 20 || ( kp.pt.x+20 ) >color.cols || ( kp.pt.y+20 ) >color.rows )
228                     continue;
229                 //depth.ptr<ushort>( kp.pt.y)获取行指针  cvRound(kp.pt,y) 表示返回跟参数值最接近的整数值 因为像素量化后是整数，而kp.pt.y存储方式是float，所以强制转换一下即可
230                 ushort d = depth.ptr<ushort> ( cvRound ( kp.pt.y ) ) [ cvRound ( kp.pt.x ) ];//16位深度图
231                 if ( d==0 )
232                     continue;
233                 Eigen::Vector3d p3d = project2Dto3D ( kp.pt.x, kp.pt.y, d, fx, fy, cx, cy, depth_scale );       //3D相机坐标系（第一帧 也是世界帧）
234         //计算小块平均灰度值作为对应单一像素的测量值 增加算法健壮性
235                 float grayscale = getPatchAverageGray( gray , kp.pt.x , kp.pt.y);
236 
237 
238                 measurements.push_back ( Measurement ( p3d, grayscale ) );
239             }
240             prev_color = color.clone();     //深拷贝color图像
241             continue;
242         }
243         // 使用直接法计算相机运动
244         //从第二帧开始计算相机位姿g2o优化
245         chrono::steady_clock::time_point t1 = chrono::steady_clock::now();
246         //优化过程中要提供灰度图像 边里面计算误差函数需要 为getPixelValue()该函数提供灰度值查找
247         poseEstimationDirect ( measurements, &gray, K, Tcw );//Tcw为世界坐标到下一帧坐标的累计值 最后Tcw的结果是从世界坐标 到当前帧下的转换
248         chrono::steady_clock::time_point t2 = chrono::steady_clock::now();
249         chrono::duration<double> time_used = chrono::duration_cast<chrono::duration<double>> ( t2-t1 );
250         cout<<"direct method costs time: "<<time_used.count() <<" seconds."<<endl;
251         cout<<"Tcw="<<Tcw.matrix() <<endl;
252 
253         // plot the feature points
254         cv::Mat img_show ( color.rows*2, color.cols, CV_8UC3 );//目的是为了之后对比前后两帧图像的关键点数量 所以建立一个可以存储pre_color 和color 大小的矩阵
255         //Rect(参数)表示坐标0,0 到cols,rows 那么大的矩形
256         //img_show.operator(const Rect &roi 参数:表示这个矩阵的某个兴趣区域)
257         //img_show.opertor返回一个构造的矩阵 Mat(const Mat& m, const Rect& roi);这个构造函数返回引用m矩阵中roi那部分感兴趣的范围
258         //最终结果是:prev_color矩阵元素拷贝到了 img_show矩阵对应Rect兴趣区域 因为img_show 是一个2*row行 cols列 可以包含两个prev_color矩阵
259         prev_color.copyTo ( img_show ( cv::Rect ( 0,0,color.cols, color.rows ) ) );//0列 0行 ->cols列 rows行 大小 //实际上就是把第一帧的图像拷贝到img_show中
260                                                                                     //因为我们针对每一帧图像都会把第一帧图像拷贝到这里 所以这里实际上执行一次即可
261                                                                                     //可以修改 前加上仅仅对第二帧执行一次即可
262         color.copyTo ( img_show ( cv::Rect ( 0,color.rows,color.cols, color.rows ) ) );//0列 rows行 ->cols列 rows行 大小
263 
264         //在measurements容器中 随机挑选出符合要求的测量值 在img_show矩阵中对应部分进行标记（因为img_show上半部分是第一帧图像，下半部分是当前图像）
265         for ( Measurement m:measurements )
266         {
267             if ( rand() > RAND_MAX/5 )
268                 continue;
269             Eigen::Vector3d p = m.pos_world;
270             Eigen::Vector2d pixel_prev = project3Dto2D ( float( p ( 0,0 ) ), p ( 1,0 ), p ( 2,0 ), fx, fy, cx, cy );//世界坐标系下的 图像坐标2D
271             Eigen::Vector3d p2 = Tcw*m.pos_world;//将空间点转换到下一帧相机坐标系下
272             Eigen::Vector2d pixel_now = project3Dto2D ( p2 ( 0,0 ), p2 ( 1,0 ), p2 ( 2,0 ), fx, fy, cx, cy );//当前帧坐标系下的图像像素坐标
273             //对于超出下一帧图像像素坐标轴范围的点 舍弃不画
274             if ( pixel_now(0,0)<0 || pixel_now(0,0)>=color.cols || pixel_now(1,0)<0 || pixel_now(1,0)>=color.rows )
275                 continue;
276             //随机获取bgr颜色 在cv::circle中 为关键点用不同的颜色圆来画出
277             float b = 255*float ( rand() ) /RAND_MAX;
278             float g = 255*float ( rand() ) /RAND_MAX;
279             float r = 255*float ( rand() ) /RAND_MAX;
280             //在img_show包含两帧图像上 以关键点为圆心画圆 半径为8个像素 颜色为bgr随机组合  2表示外轮廓线宽度为2 如果为负数则表示填充圆
281             //pixel_prev 都是世界坐标系下的坐标 (以第一帧为参考系) 和当前帧下的对比 可以看出关键点的数量会逐渐减少
282             cv::circle ( img_show, cv::Point2d ( pixel_prev ( 0,0 ), pixel_prev ( 1,0 ) ), 8, cv::Scalar ( b,g,r ), 2 );
283             cv::circle ( img_show, cv::Point2d ( pixel_now ( 0,0 ), pixel_now ( 1,0 ) +color.rows ), 8, cv::Scalar ( b,g,r ), 2 );//注意这里+color.rows 当前帧在img_show的下半部分
284             //连接前后两针匹配好的点
285             cv::line ( img_show, cv::Point2d ( pixel_prev ( 0,0 ), pixel_prev ( 1,0 ) ), cv::Point2d ( pixel_now ( 0,0 ), pixel_now ( 1,0 ) +color.rows ), cv::Scalar ( 0,0,250 ), 1 );
286         }
287         cv::imshow ( "result", img_show );
288         cv::waitKey ( 0 );
289 
290     }
291     return 0;
292 }
293 
294 void poseEstimationDirect ( const vector< Measurement >& measurements, cv::Mat* gray, Eigen::Matrix3f& K, Eigen::Isometry3d& Tcw )
295 {
296     // 初始化g2o
297     typedef g2o::BlockSolver<g2o::BlockSolverTraits<6,1>> DirectBlock;  // 求解的向量是6＊1的
298     DirectBlock::LinearSolverType* linearSolver = new  g2o::LinearSolverDense< DirectBlock::PoseMatrixType >();
299     DirectBlock* solver_ptr = new DirectBlock(unique_ptr<DirectBlock::LinearSolverType>(linearSolver));
300     g2o::OptimizationAlgorithmLevenberg *solver =new g2o::OptimizationAlgorithmLevenberg(unique_ptr<DirectBlock>(solver_ptr));
301     // g2o::OptimizationAlgorithmGaussNewton* solver = new g2o::OptimizationAlgorithmGaussNewton( solver_ptr ); // G-N
302 
303     g2o::SparseOptimizer optimizer;
304     optimizer.setAlgorithm ( solver );
305     optimizer.setVerbose( true );
306 
307     auto pose = new g2o::VertexSE3Expmap();
308     pose->setEstimate ( g2o::SE3Quat ( Tcw.rotation(), Tcw.translation() ) );
309     pose->setId ( 0 );
310     optimizer.addVertex ( pose );
311 
312     // 添加边
313     int id=1;
314     for ( Measurement m: measurements )
315     {
316         auto edge = new EdgeSE3ProjectDirect (
317             m.pos_world,
318             K ( 0,0 ), K ( 1,1 ), K ( 0,2 ), K ( 1,2 ), gray
319         );
320         edge->setVertex ( 0, pose );//设置一元边链接的顶点
321         edge->setMeasurement ( m.grayscale );//设置测量值 即把前一帧关键点的灰度值作为测量值 供给下一帧进行匹配计算RT
322         edge->setInformation ( Eigen::Matrix<double,1,1>::Identity() );//因为误差维度是1 所以信心矩阵为1x1
323         edge->setId ( id++ );
324         optimizer.addEdge ( edge );
325     }
326     cout<<"edges in graph: "<<optimizer.edges().size() <<endl;//边的个数 实际上反应了关键点的个数
327     optimizer.initializeOptimization();
328     optimizer.optimize ( 30 );
329     Tcw = pose->estimate();
330 }
331 
332 
333 //获取小块平均灰度值
334 // gray:灰度矩阵 x,y表示以(x,y)为中心  计算的小块的平均灰度
335 float getPatchAverageGray(const cv::Mat &gray ,float u, float v){
336     int x = cvRound(u);
337     int y = cvRound(v);
338    
339     float grayscale = 0.0;
340 
341     for (int j = y-1; j <= y+1 ; ++j)
342         for(auto i = x-1;i<= x+1; ++i){
343             grayscale += float ( gray.ptr<uchar> (j)[i] );
344         }
345     //grayscale/= ( (2*patchRadius + 1)*(2*patchRadius +1) );
346     grayscale/=9;
347     return grayscale;
348 }

4.使用Ceres实现RGB-D上的稀疏直接法和半稠密直接法。