基于Sentinel-2数据的天山山地针叶林识别方法研究
1.
2.
An Identification Method for Mountains Coniferous in Tianshan with Sentinel-2 Data
1.
2.
通讯作者:
收稿日期: 2019-12-30 修回日期: 2021-03-15 网络出版日期: 2021-09-26
基金资助: |
|
Received: 2019-12-30 Revised: 2021-03-15 Online: 2021-09-26
作者简介 About authors
蒋嘉锐(1995-),男,云南曲靖人,硕士研究生,主要从事植被遥感、植被物候以及土地覆盖分类研究E⁃mail:
关键词:
Keywords:
本文引用格式
蒋嘉锐, 朱文泉, 乔琨, 江源.
Jiang Jiarui, Zhu Wenquan, Qiao Kun, Jiang Yuan.
1 引 言
山地阴影对山地植被类型遥感识别存在较为显著的影响,如何避免山地阴影的影响是许多学者关注的热点问题[1-4]。现有常用的方法是通过地形校正来消除阴影[5],该方法对于坡度较小的区域效果较好,但对于坡度较大的区域则会出现过矫正现象,而且随着坡度增加过矫正现象更为严重[6]。因此,对于地形起伏剧烈且有着较深山地阴影的区域内,则需要探索其他方法来降低阴影对植被分类的影响。利用不同时段获取的多源遥感数据进行山地光学影像阴影区域的识别和再分类则是另外一种思路[7],其主要是利用同一区域两期或者两期以上具有不同太阳高度角和方位角的影像,根据阴影在两期影像上的分布位置差异来识别出阴影内的实际地物类型。但这种基于两期影像的阴影识别与再分类方法是否适用于坡度较大的山地地区以及是否能有效提高山地植被类型的识别精度则有待进一步研究。
山地植被类型的分布斑块相对较小[8],因此需基于中高空间分辨率(如优于100 m)的遥感数据才能更好地将其识别。而有着短重访周期、高空间分辨率以及适合植被监测的红边波段的Sentinel-2数据在植被遥感识别研究中发挥了巨大的应用潜力[9-11]。虽然Sentinel-2数据可以提供更加清晰、丰富的地物信息,但Sentinel-2成像均在当地时间上午11点左右,由于山地地形起伏较大,因此会在北坡和西北坡存在着大量的阴影。位于中国北方温带干旱区的天山山地针叶林生长主要受水分因子的限制,因此天山山地针叶林主要分布在海拔1 400~2 800 m的阴坡和半阴坡[12],而这些阴坡区域在上午成像时恰好落在遥感影像的阴影区。因此,在Sentinel-2影像上,阴影对天山针叶林识别的影响可能更为严重。
实验以天山山地针叶林为研究目标,针对其空间分布特点,从遥感数据阴影分布的时相特性、分类特征以及分类器选择等三方面进行综合分析,旨在提出一种适用于天山山地针叶林的遥感综合分类方案,并期望该遥感综合分类方案经参数调整之后能应用于北方干旱半干旱区的其他山地针叶林区域。
2 数据与方法
2.1 研究区概况
天山横亘于新疆中部,绵延中国境内1 700 km,其地理坐标为73°30′~96°45′ E,40°10′~44°30′ N。选取新疆天山山脉内一块Sentinel-2影像作为研究区, 影像面积约为10 000 km2。研究区内以天山云杉为主的针叶林主要分布于海拔1 400~2 800 m的阴坡和半阴坡。研究区内土地覆盖类型主要包括针叶林(天山云杉)、草地、农作物、建设用地、水体、裸地以及积雪等。研究区内地形复杂,其中研究区北部分布着较大范围的针叶林,中部和南部分布着较为密集的山地和丘陵,这里的地形起伏较大,遥感影像上分布着大片的山地阴影,其中夹杂着部分针叶林,经常与山地阴影重合(图1)。
图1
图1
研究区地理位置
(图中影像为2018年9月19日RGB真彩色合成的Sentinel⁃2影像;使用反地形校正方法[13]突出了山体地形起伏)
Fig.1
The distribution of study area
2.2 数据获取
遥感影像选取的是欧洲空间局Sentinel-2卫星数据,空间分辨率为10 m(蓝、绿、红、近红外)、20 m(红边、短波红外)以及60 m(水蒸气、卷云波段)(
DEM数据是于2015年1月6日正式发布的ASTER GDEM V2 30 m全球数字高程数据,数据来源于中国科学院计算机网络信息中心地理空间数据云平台(
另外,结合原始遥感影像以及Google Earth高分辨率数据在研究区范围内选取了训练样本,得到了1 254个训练样本点(其中草地208个、针叶林254个、农作物177个、阴影114个、建筑用地177个、水域81个、裸地184个、雪地59个),其中要确保样本充分覆盖研究区并满足均匀分布(图2)。其中阴影样本选择的是光线完全被山体遮挡的区域,已完全看不出阴影下方的地物类型。
图2
图2
研究区训练样本点分布图
(图中影像为2018年9月19日RGB真彩色合成的Sentinel⁃2影像)
Fig.2
The distribution of training samples in the study area
2.3 方 法
研究利用Sentinel-2数据,结合DEM数据,基于地物的光谱特征和地形特征,在特征筛选的基础上使用3种不同的分类器来识别研究区内的针叶林和阴影,然后用同一区域不同时相的Sentinel-2影像来辅助识别存在于阴影中的针叶林。技术路线如图3所示。
图3
2.3.1 数据预处理
根据实验的研究目标,需要对获取的原始数据进行预处理,主要包括:①对获取的Sentinel-2原始影像利用欧空局提供的Sen2cor插件对影像进行辐射定标和大气校正,利用SNAP(the Sentinel Application Platform, version6.0.0)软件将影像20 m和60 m的几个波段双线性重采样成10 m;②利用原始30 m的DEM数据,使用ENVI(The Environment for Visualizing Images, version5.5)软件中的Topographic Modeling工具计算研究区内的坡度和坡向;③将30 m的DEM、坡度和坡向数据利用ENVI软件采用最近邻采样方法将数据重采样成10 m空间分辨率的数据,与Sentinel-2数据的空间分辨率保持一致;④为了消除由于地形起伏而引起的影像辐亮度值的变化,这里利用ENVI的Topographic Correction扩展工具对Sentinel-2原始影像进行地形校正,使用的地形校正模型是校正效果较好且适用性广的C校正模型,考虑到原始的DEM影像是从30 m空间分辨率重采样到10 m,因此卷积核大小设置为7×7个像元,根据Sentinel-2原始影像的元文件获取该图像的太阳高度角和方位角信息,得到地形校正结果。
2.3.2 分类特征筛选
考虑到Sentinel-2影像的光谱特征以及地形特征,主要提取了15个特征:
随机森林(Random Forest,RF)算法是由Breiman[16]提出的一种基于决策树组合构成的机器学习算法,适用于处理高维数据,不易产生过拟合。随机森林的一个重要应用是能够计算单个特征变量的重要性,因此可以利用随机森林算法来评估每个特征变量对于针叶林识别的重要性和贡献度。在土地覆盖分类研究中通常情况下树的个数设为150最佳[17]。随机森林算法主要利用OOB(Out Of Bag)误差来计算特征变量的重要性。特征重要性计算的方法是计算每一棵决策树的OOB误差,之后针对某特征M在数据中加入干扰并再次计算OOB误差,OOB误差增加幅度越大即精准度下降越多则说明特征M重要性越高[18]。另外,考虑到训练样本的各类特征中可能存在噪声,将特征M的原始分数除以其标准差获得的z-score作为最终的重要性分数来进行排序更为准确和可靠。
2.3.3 分类器选择
因此,为了比较这些分类器之间的性能,筛选出研究区内针叶林识别的最佳分类器,实验利用SVM、RF和BPNN等3种分类器对9月份的Sentinel-2图像开展针叶林识别研究,主要识别出针叶林和阴影,并对比3种分类器的分类结果,筛选出最优的分类器。其中SVM、RF利用EnMAP-Box工具包[23]实现。该工具包是由德国环境制图与分析计划(Environmental Mapping and Analysis Program)项目组开发,提供了SVM、RF等分类器,其中SVM分类模块集成了网格搜索参数优化功能,能够以自动化的方式确定SVM的最优分类参数。BPNN则是通过ENVI工具包(Neural Net Classfication)实现。
2.3.4 阴影再分类
基于9月份的影像分类完成后虽然获得了针叶林和阴影的分类图,由于针叶林分布的特殊性,在图像的某些阴影中也会存在针叶林,仅靠单期影像无法识别出这一部分针叶林。在不同季节,由于太阳方位角和高度角的改变,从而导致阴影的方位和覆盖范围也会随之发生变化。在9月份的Sentinel-2影像中识别为阴影的区域,在5月份的影像中阴影位置会发生改变,此时能将原本的阴影区域分类为正确的地物(图4)。其中,通过查看5月份原始的Sentinel-2影像和Google Earth影像,可知在阴影区域覆盖下的地表类型主要有针叶林、草地、裸地、雪地以及阴影。因此,将9月份影像分类结果中的阴影作为掩膜,在阴影范围内,基于5月份原始的Sentinel-2影像和Google Earth影像重新选择训练样本对阴影区域再分类,从而识别出存在于阴影中的针叶林。
图4
2.3.5 分类精度评价
分类结果的精度评价采用混淆矩阵方法,使用分层抽样获取研究区各类地物样本作为验证点数据,并结合Google Earth高分辨率影像确定每个验证点的真实性,对不确定的点进行删除。实验仅将针叶林作为主要研究目标,因此在精度评价中分类结果和验证样本仅保留针叶林,除针叶林以外的所有地物均合并成一种(非针叶林)。最终获得345个验证样本点,其中针叶林153个,非针叶林192个。
3 结 果
3.1 地形校正的地物光谱可区分性
经过地形校正后的Sentinel-2影像与原始影像相比(图5),有着轻微阴影的阴坡亮度基本恢复,在有较重阴影的阴坡亮度却没有改善。
图5
图6
图6
地形校正前后地物光谱曲线
(阴影范围代表该类地物反射率的均值±标准差;雪的反射率因在600~1 200 nm太大未完整显示)
Fig.6
Comparison of spectral curves for different land cover before and after topographic correction
3.2 特征重要性排序
表1展示的是利用随机森林特征选择方法计算得到的15个特征变量的z-score。排序靠前的特征是海拔、NDVI、B4~B8波段斜率、B2(蓝光)、B4(红光)、B11(短波红外)和坡度,后续的研究中将选取这7个特征进行分类。
表1 特征重要性排序表
Table 1
序号 | z-score | 变量名称 | 序号 | z-score | 变量名称 |
---|---|---|---|---|---|
1 | 3.03 | DEM | 9 | 0.94 | B7 |
2 | 1.54 | NDVI | 10 | 0.86 | B8A |
3 | 1.19 | 斜率(B4~B8) | 11 | 0.78 | B6 |
4 | 1.06 | B2 | 12 | 0.77 | B5 |
5 | 1.05 | B4 | 13 | 0.72 | B8 |
6 | 1.01 | B11 | 14 | 0.67 | B3 |
7 | 1.01 | 坡度 | 15 | 0.36 | 坡向 |
8 | 0.97 | B9 |
3.3 分类器分类效果目视比较
图7
3.4 分类结果与精度评价
图8展示了针叶林遥感识别结果,可以看到在研究区中部和北部的针叶林基本不受到阴影的影响。这是因为在研究区北部和中部,针叶林都是成片存在且分布的位置比较平坦,受到阴影的影响较小。而在研究区的南部和东南部山地较多且坡度大,部分针叶林与阴影位置重合,只能在第二次分类中被识别出来。
图8
为了对比不同分类器在针叶林识别上的准确度,用同一套验证样本点分别对SVM、RF和BPNN 3种分类器进行初分类和阴影再分类后的针叶林识别结果进行精度评价。同时为了探究分类体系中考虑阴影前后是否会引起针叶林识别精度的变化,在分类体系中不加入阴影的情况下用同一套特征、训练样本以及分类器来识别针叶林并进行精度评价。由表2可见,从总体分类精度上来看,在分类体系中考虑阴影的情况下3种分类器的总体精度均高于在分类体系中不考虑阴影的总体精度,总体精度提高了1.3%~3.7%左右。由此可以说明阴影对针叶林识别的影响十分显著,要获取准确的针叶林分布信息必须要将阴影的影响剔除。另外,随着分类器类型的不同,针叶林的总体分类精度也会有一定的变化。其中,3种分类器的总体分类精度排序是SVM>BPNN>RF,SVM分类器精度比其他两种分类器高,更加适用于天山山地针叶林识别。
表2 针叶林遥感识别结果的精度评价
Table 2
SVM | RF | BPNN | |||||
---|---|---|---|---|---|---|---|
生产者精度% | 用户 精度% | 生产者精度% | 用户 精度% | 生产者精度% | 用户 精度% | ||
不考虑阴影 | 针叶林 | 88.22 | 90.01 | 84.96 | 89.66 | 85.62 | 87.92 |
非针叶林 | 92.18 | 90.76 | 92.19 | 88.50 | 90.63 | 88.78 | |
总分类精度% | 90.43 | 89.99 | 88.40 | ||||
Kappa系数 | 0.80 | 0.77 | 0.76 | ||||
SVM | RF | BPNN | |||||
生产者精度% | 用户 精度% | 生产者精度% | 用户 精度% | 生产者精度% | 用户 精度% | ||
考虑阴影 | 针叶林 | 93.46 | 91.67 | 88.24 | 91.84 | 93.15 | 88.89 |
非针叶林 | 93.23 | 94.71 | 93.75 | 90.91 | 94.79 | 91.46 | |
总分类精度% | 93.33 | 91.30 | 92.17 | ||||
Kappa系数 | 0.87 | 0.82 | 0.84 |
4 讨 论
4.1 阴影对分类结果的影响
图9
图9
不考虑阴影影响下的针叶林识别结果
Fig.9
Identification results for mountainous coniferous forest with ignoring shadows
在消除阴影的影响之后,利用3种分类器识别针叶林的总体精度均高于未考虑阴影的识别结果,总体精度普遍提高了1.3%~3.7%,这与Huang等[1]和Vanonckelen等[2]基于地形校正消除阴影影响后提高的森林总体分类精度程度类似。虽然采用阴影再分类的方法获得的针叶林空间分布更为准确,但是仍存在一些问题会限制识别精度的提高。阴影从构成原理上分为本影、投影以及半影区,这3种阴影在阴影检测中都被分为阴影区[25]。其中针对不同时相而言,阴影投影和半影区的位置会随着太阳高度角的变化而有所不同,虽然本影区域也有可能在太阳高度角较高的时候收到太阳辐射,但更多的时候太阳方位角对阴影本影位置的影响会更大。实验所选的两期Sentinel-2影像在太阳高度角上差异较大,但是太阳方位角差异不大,因此阴影本影位置基本不会有太大变化,位于本影区域的针叶林难以识别。如果想让阴影完全错开,可以考虑在同一地区的上午和下午分别成像,这样就能保证两期影像阴影部分不重叠,有助于更为准确地识别出阴影中的针叶林。另外,本文方法需要在两期影像上均选择一套训练样本,如果需要识别整个天山区域的针叶林会有较大的工作量,不利于大范围的推广。所以需要在训练样本上有所改进,以便于适应大范围的针叶林识别。
4.2 特征选择对分类结果的影响
在前面的特征选择结果中可以看出,排序靠前的几个特征分布是:海拔、NDVI、B4~B8波段的斜率、B2(蓝光)、B4(红光)、B11(短波红外)和坡度(表1)。其中海拔和坡度均有很高的重要性,特别是海拔特征重要性远高于其他特征。这是因为天山针叶林的分布比较集中,主要分布于海拔1 400~2 800 m的阴坡和半阴坡,因此地形因子对针叶林提取的贡献度较高。蓝光、短波红外、红光波段、NDVI 以及B4~B8波段的斜率也有很高的贡献度,这是因为蓝光和短波红外波段对土壤背景反映敏感,在裸地与植被的区分中作用较大[26];同时,研究区域内林地、草地等植被面积所占比重较高,所以红光波段和NDVI贡献度也比较高。剩余B4~B8波段的斜率主要体现了红边波段的信息,表明了红边波段数据添加确实对植被识别十分重要,这与Forkuor等[27-28]的研究结论相一致。另外,单独的几个红边波段(B5、B6和B7)和近红外波段(B8和B8a)贡献度均不高,这主要是因为已经将B4~B8波段的斜率作为一个特征,该特征几乎已经包含了红边波段和近红外波段所体现的信息,从而使得这几个单独的红边波段和近红外波段贡献度不高。
4.3 分类器对分类结果的影响
在总分类精度上,RF和BPNN总分类精度要比SVM略差一点,RF分类误差来源主要是因为部分针叶林错分为阴影。而SVM和BPNN基本能够将阴影准确识别出来,但BPNN容易将其他地物(特别是草地)误分成针叶林从而引起误差。SVM既能在准确识别阴影的同时也能准确识别针叶林,分类效果最佳。从分类器原理来看,随机森林是由若干弱分类器组合而来得到的一个分类性能显著的强分类器,即使没有超参数调整,大多数情况下也会带来好的结果,但是随机森林在噪声比较大的样本集上容易陷入过拟合现象[29]。阴影本身就能看作一种使地物目标反映的信息量有所损失的“噪声”,其样本集则表现出了较大的噪声,因此RF在阴影的识别上有所欠缺。而BPNN在处理模糊数据以及非线性数据方面具有明显优势,在图像分类上有着较大的容错率,但仍存在容易陷入局部最优、算法收敛慢以及针对多样化的求解问题泛化能力不强等问题[30]。与BPNN相似,SVM作为所有知名的数据挖掘算法中最健壮,最准确的方法之一,在解决小样本、非线性识别等问题中表现出许多特有的优势[31]。因此SVM在区分线性不可分的阴影、草地以及针叶林时会有比较好的效果。
5 结 论
以天山山地针叶林为研究目标,从遥感数据阴影分布的时相特性、分类特征以及分类器选择三方面进行综合分析,提出了一种适用于天山山地针叶林的遥感综合分类方案:
(1)由于山地阴影和部分针叶林重叠现象频繁,且阴影和针叶林之间存在一定的混分现象,采用地形校正方法来消除山体阴影的效果不但不明显,反而还会造成过矫正现象,从而影响后续的针叶林识别,但利用太阳高度角和方位角差异较大的两期影像开展阴影识别以及阴影再分类来排除阴影对针叶林识别的影响,可使针叶林的总体精度提高1.3%~3.7%。
(2)在分类特征方面,考虑到针叶林分布集中在海拔1 400~2 800 m的阴坡和半阴坡,除了光谱特征以外,还需重点考虑地形地貌特征,实验选择出的分类特征按重要性由高到低分别是:海拔、NDVI、红光到近红外波段斜率、蓝光波段、红光波段、短波红外波段和坡度。
(3)RF、SVM和BPNN 3种分类器都能取得较好的山地针叶林识别精度,但SVM分类器的分类精度最高,总体分类精度和Kappa系数分别是93.33%和0.87,更适合天山山地针叶林的识别。
虽然实验提出的天山山地针叶林遥感综合分类方案获得了较高的分类精度,但仍然存在一些问题亟待改进。例如两期影像虽然因为太阳方位角和高度角的不同,阴影的覆盖范围有所变化,但是仍有一部分阴影重叠区域无法去除。在今后的研究中,可以利用一天内上午和下午的影像进行针叶林识别,这样就能较好地解决阴影的问题。
参考文献
Reduction of atmospheric and topographic effect on Landsat TM data for forest classification
[J]. ,
The effect of atmospheric and topographic correction on pixel-based image composites: improved forest cover detection in mountain environments
[J]. ,
Methods of extracting distribution information of plants at urban darken areas and repairing their brightness
[J]. ,
城镇阴影区植物分布信息提取与亮度修复的方法
[J].,
Optimization of shadow detection and compensation method for high-resolution remote sensing images
[J]. ,
高分辨率遥感影像阴影检测与补偿方法优化
[J]. ,
Simplification and modification of a physical topographic correction algorithm for remotely sensed data
[J]. ,
遥感影像地形校正物理模型的简化与改进
[J]. ,
The comparison of reflectance based on different terrain correction
[J]. ,
基于不同地形校正模型的影像反射率对比分析
[J]. ,
Restoration of information obscured by mountain shadows for Landsat TM images based on MODIS NDVI
[J]. ,
基于MODIS NDVI的Landsat TM影像地形阴影区光谱信息恢复方法研究
[J]. ,
Research progress and future perspectives on the landscape ecology of mountainous areas
[J]. ,
山地景观生态学研究进展
[J]. ,
Research on leaf area index retrieve methods based on the red edge bands from multi-platform remote sensing data
[D].
考虑红边特性的多平台遥感数据叶面积指数反演方法研究
[D].
Classification of land use in low mountain and hilly area based on random forest and Sentinel-2 satellite data: a case study of Lishi town, Jiangjin, Chongqing
[J]. ,
基于随机森林和Sentinel-2影像数据的低山丘陵区土地利用分类——以重庆市江津区李市镇为例
[J]. ,
Classification of picea crassifolia and sabina przewalskii based on multi-source remote sensing images
[J]. ,
基于多源遥感影像的青海云杉和祁连圆柏分类
[J]. ,
Distribution patterns of picea schrenkiana Var. tianschanica population in Tianshan mountains
[J]. ,
天山云杉种群分布格局
[J]. ,
A correction technique for false topographic perception of remote sensing images based on an inverse topographic correction technique
[J]. ,
Effect of red-edge and texture features for object-based paddy rice crop classification using rapid eye multi-spectral satellite image data
[J]. ,
Testing the red ddge channel for improving land-use classifications based on high-resolution multi-spectral satellite data
[J]. ,
Finer fesolution observation and monitoring of global land cover: first mapping results with landsat TM and ETM+ data
[J]. ,
The classification of urban greening tree species based on feature selection of random forest
[J]. ,
基于随机森林特征选择的城市绿化乔木树种分类
[J]. ,
A survey of image classification methods and techniques for improving classification performance
[J]. ,
Comparative performance of convolutional neural network, weighted and conventional support vector machine and random forest for classifying tree species using hyperspectral and photogrammetric data
[J]. ,
Comparison of fandom forest, k-nearest neighbor, and support vector machine classifiers for land cover classification using Sentinel-2 imagery
[J]. ,
Effect of classifier selection, reference sample size, reference class distribution and scene heterogeneity in per-pixel classification aaccuracy using 26 Landsat sites
[J]. ,
The enMAP-box—a toolbox and application programming interface for enMAP data processing
[J]. ,
Study on the identification method of glacier in mountain shadows based on Landsat 8 OLI image
[J]. .
Review of shadow detection and de-shadowing methods in remote sensing
[J]. ,
Relationships between percent vegetation cover and vegetation indices
[J]. ,
Landsat-8 vs. Sentinel-2: dxamining the added value of Sentinel-2's red-edge bands to land-use and land-cover mapping in Burkina Faso
[J]. ,
Evaluating Sentinel-2 and Landsat 8 data to map sucessional forest stages in a subtropical forest in Southern Brazil
[J]. ,
Classification of china small satellite remote sensing image based on random forests
[J]. ,
基于随机森林的国产小卫星遥感影像分类研究
[J]. ,
An artificial neural network method for vegetation cover retrieval with "Beijing-1" microsatellite data
[J]. ,
基于人工神经网络的植被覆盖遥感反演方法研究
[J]. ,
The principle and prospect of Support Vector Machine
[J]. ,
支持向量机原理及展望
[J]. ,
Application of deep learning in globeLand 30-2010 product refinement
[J]. ,
深度学习在GlobeLand30-2010产品分类精度优化中应用研究
[J]. ,
Very deep convolutional networks for large-scale image recognition
[J]. ,
/
〈 | 〉 |