遥感影像提取农作物种植分布数据之经验总结

最近在做利用Sentinel-2影像提取湖北省棉花种植分布,前前后后快两个月了,学到一些东西,记录一下。

1、目标作物最好是研究区内的主要作物,种植面积大、分布广泛,这样方便获取作物在影像上的光谱特征,训练样本、验证样本也好获取,实地调研难度也小;

本次提取的是湖北省的棉花分布数据,但受农村劳力流失、棉花种植人力物力成本高等因素影响,棉花种植面积逐年减少,农民转而种植大豆、玉米等田间管理少、人力成本低的作物。棉花在湖北省不再是大面积种植,除少数试验田外,都是零零散散的分布,田间地头、房前屋后,棉花田块面积小,分布不集中,在10m哨兵数据上极易出现混合像元问题,很难识别出棉花的特征,同时制作训练样本和验证样本也极为困难(实地调研找不到);

2、承接前述1中的问题,因为目标作物分布不集中,都是小田块,实地调研时手机拍照定位存在数米的误差,在10米的哨兵影像上,实地调研点就很可能出现位置偏差,造成训练样本错误

上述两条主要说明目标作物应是研究区内的主要作物。

3、提取某年份作物分布时,最好时当年去实地调研,否则农户极可能存在种植属性记忆模糊,尤其是对于小地块、非主要作物;

4、训练样本、验证样本比例应该是七三或八二

5、验证样本中各个类别的样本数量和大小应当基本持平,不应存在较大出入,否则利用混淆矩阵作精度评价时,易分地物的高精度会掩盖难分地物的低精度,虽然总体精度较高,但某些作物分类精度可能很低;

本次提取棉花时,起初验证样本中水体、水稻等地物样本数量较多,棉花样本数量较少,水体、建设用地、水稻等地物分类精度高,就掩盖了棉花的低精度;

上述两条主要说明样本选择注意事项。

6、受云雾影像,作物生长期内,很难获取到逐月满足要求的影像,造成某些敏感时期影像缺失,无法准确区分某些地物,此处对专家决策树法影响较大;

本次提取棉花过程中,起初采用专家决策树方法,7月上中旬,水稻田里还有积水,利用NDWI可以有效识别,9月中旬,大豆基本收割完成,棉花还处于吐絮期,可以有效区分两者,但受云雾影像,两期影像都不能采用,给决策树法提取棉花带来很大困难。

7、不能单纯使用植被指数建立决策树提取作物,某些作物长势不均衡,单用植被指数进行阈值分割,极容易出现空洞现象(地物中心被掏去一部分)或保留边缘轮廓(田埂、庄稼小路被误分)。

8、如何从光谱特征、植被指数、纹理特征等众多特征中筛选最有利于分类的特征???

追更

9、利用A区样本和影像训练的模型,如果要将其应用于B区,要注意影像光谱特征的归一化处理或统一拉伸,否则A区训练的模型完全不适用与B区,就像深度学习中,首先要将研究区内影像拉伸至32767或归一化,然后再训练模型,最后将模型应用于其他区域;

10、不是所有植被指数都像NDVI一样,上下相除可以自动抵消缩放系数,一旦植被指数计算式中存在加减常数,此时就应该先把DN值转为反射率数据再计算;

比如:EVI=2.5*(NIR-Red)/(NIR+6*Red-7.5*Blue+1),分母中存在常数1,乘以缩放系数与不乘以缩放系数的结果是完全不一致的。

原文地址:https://www.cnblogs.com/jkmlscy/p/15046928.html