遥感影像提取农作物种植分布数据之经验总结

最近在做利用Sentinel-2影像提取湖北省棉花种植分布，前前后后快两个月了，学到一些东西，记录一下。

1、目标作物最好是研究区内的主要作物，种植面积大、分布广泛，这样方便获取作物在影像上的光谱特征，训练样本、验证样本也好获取，实地调研难度也小；

本次提取的是湖北省的棉花分布数据，但受农村劳力流失、棉花种植人力物力成本高等因素影响，棉花种植面积逐年减少，农民转而种植大豆、玉米等田间管理少、人力成本低的作物。棉花在湖北省不再是大面积种植，除少数试验田外，都是零零散散的分布，田间地头、房前屋后，棉花田块面积小，分布不集中，在10m哨兵数据上极易出现混合像元问题，很难识别出棉花的特征，同时制作训练样本和验证样本也极为困难(实地调研找不到)；

2、承接前述1中的问题，因为目标作物分布不集中，都是小田块，实地调研时手机拍照定位存在数米的误差，在10米的哨兵影像上，实地调研点就很可能出现位置偏差，造成训练样本错误；

上述两条主要说明目标作物应是研究区内的主要作物。

3、提取某年份作物分布时，最好时当年去实地调研，否则农户极可能存在种植属性记忆模糊，尤其是对于小地块、非主要作物；

4、训练样本、验证样本比例应该是七三或八二；

5、验证样本中各个类别的样本数量和大小应当基本持平，不应存在较大出入，否则利用混淆矩阵作精度评价时，易分地物的高精度会掩盖难分地物的低精度，虽然总体精度较高，但某些作物分类精度可能很低；

本次提取棉花时，起初验证样本中水体、水稻等地物样本数量较多，棉花样本数量较少，水体、建设用地、水稻等地物分类精度高，就掩盖了棉花的低精度；

上述两条主要说明样本选择注意事项。

6、受云雾影像，作物生长期内，很难获取到逐月满足要求的影像，造成某些敏感时期影像缺失，无法准确区分某些地物，此处对专家决策树法影响较大；

本次提取棉花过程中，起初采用专家决策树方法，7月上中旬，水稻田里还有积水，利用NDWI可以有效识别，9月中旬，大豆基本收割完成，棉花还处于吐絮期，可以有效区分两者，但受云雾影像，两期影像都不能采用，给决策树法提取棉花带来很大困难。

7、不能单纯使用植被指数建立决策树提取作物，某些作物长势不均衡，单用植被指数进行阈值分割，极容易出现空洞现象(地物中心被掏去一部分)或保留边缘轮廓(田埂、庄稼小路被误分)。

8、如何从光谱特征、植被指数、纹理特征等众多特征中筛选最有利于分类的特征？？？

追更

9、利用A区样本和影像训练的模型，如果要将其应用于B区，要注意影像光谱特征的归一化处理或统一拉伸，否则A区训练的模型完全不适用与B区，就像深度学习中，首先要将研究区内影像拉伸至32767或归一化，然后再训练模型，最后将模型应用于其他区域；

10、不是所有植被指数都像NDVI一样，上下相除可以自动抵消缩放系数，一旦植被指数计算式中存在加减常数，此时就应该先把DN值转为反射率数据再计算；

比如：EVI=2.5*(NIR-Red)/(NIR+6*Red-7.5*Blue+1)，分母中存在常数1，乘以缩放系数与不乘以缩放系数的结果是完全不一致的。