img

官方微信

遥感技术与应用, 2022, 37(5): 1071-1083 doi: 10.11873/j.issn.1004-0323.2022.5.1071

LiDAR专栏

基于背包激光雷达的单木材积估测方法研究

马超,1, 黄华国1, 田昕,2, 刘炳杰1, 温坤剑1, 王鹏杰2

1.北京林业大学 森林资源和环境管理国家林草局重点实验室,北京 100083

2.中国林业科学研究院资源信息研究所,北京 100091

Research on Individual Tree Volume Estimation Using Backpack LiDAR

Ma Chao,1, Huang Huaguo1, Tian Xin,2, Liu Bingjie1, Wen Kunjian1, Wang Pengjie2

1.Beijing Forestry University Forest Resources and Environmental Management National Forest and Grass Bureau Key Laboratory,Beijing 100083,China

2.Institute of Forest Resource Information Techniques,Chinese Academy of Forestry,Beijing 100091,China

通讯作者: 田 昕(1979-),男,贵州黔东南人,研究员,主要从事遥感技术应用研究。E⁃mail: tianxin@ifrit.ac.cn

收稿日期: 2021-12-08   修回日期: 2022-07-21  

基金资助: 中国林业科学研究院中央级公益性科研院所基本科研业务费专项资金项目“森林资源出数关键技术研究”.  CAFYBB 2021SY006
国家自然科学基金项目“森林地上生物量动态信息时空协同分析及建模”.  41871279
国家自然科学基金项目“基于相关生长理论的森林光学微波信息互补机理研究”.  41971289
高分辨率对地观测系统重大专项课题“高分共性产品真实性检验相关标准规范编制”.  21-Y20B01-9001-19/22-1

Received: 2021-12-08   Revised: 2022-07-21  

作者简介 About authors

马超(1994-),男,浙江上虞人,硕士研究生,主要从事遥感技术应用研究E⁃mail:machao31@126.com , E-mail:machao31@126.com

摘要

背包式激光雷达(Backpack Laser Scanning, BLS)在森林资源调查中具有很大的应用潜力,但在复杂地表情景下,单木材积和林分蓄积量提取精度存在较大不确定性。以广西高峰林场为研究区,利用随机森林方法,基于BLS点云数据对单木材积和样地蓄积量进行估测。首先,对BLS点云进行单木分割,提取单木胸径(DBH)、树高(Htree)、冠幅直径(CD)、冠幅面积(CA)、冠幅体积(CV)、郁闭度(CC)、间隙率(GF)和叶面积指数(LAI)共8个特征参数,并计算56个分层高度指标(高度百分比、累积高度百分比、变异系数、冠层起伏率等)。然后,通过随机森林算法构建单木材积估测模型,并对比各种参数组合的预测精度。得到结果: ①仅用8个单木结构特征参数进行建模,估测精度为: R²=0.83、RMSE=0.097 m3; ②加入分层高度指标的模型估测精度有所提升: R²=0.87、RMSE=0.087 m3;③通过Boruta算法进行变量筛选,输入参数从64个减少至52个,估测精度差异不大: R2= 0.87、RMSE=0.087 m3;④样方蓄积量估测精度为: R2=0.97,RMSE=0.703 m3·ha-1。结果表明,基于BLS点云建立随机森林单木材积估测模型可以较好地估测单木材积,样方蓄积量估测精度高。

关键词: 单木材积 ; 背包式激光雷达 ; 随机森林算法 ; Boruta算法

Abstract

Backpack Laser Scanning (BLS) is a potential tool in forest resource survey, but shows much uncertainty for the extraction accuracy of single-tree volume and forest stand volume in complex topographic circumstances. Using BLS point cloud data from the Gaofeng Forest Farm in Guangxi Province, this study implemented the estimation of single-tree volume and sample plot volume by random forest approach. First, individual tree segmentation was conducted using the BLS point cloud data, 8 characteristic parameters were extracted including Diameter at Breast Height (DBH), Tree Height (Htree), Crown Diameter (CD), Crown Area (CA), Crown Volume (CV), Canopy Cover (CC), Gap Fraction (GF), and Leaf Area Index (LAI), and 56 stratification height indicators were calculated (height percentage, cumulative height percentage, coefficient of variation, canopy undulation rate, etc.). Then, an individual treee volume estimation model was developed using the random forest technique, and the prediction accuracy of various parameter combinations was investigated. The results showed that: (1) modeling with only 8 characteristic parameters of an individual tree structure indicated an estimated accuracy of R²=0.83、RMSE=0.097 m3; (2) modeling estimation accuracy was improved with the addition of the layered height index: R²=0.87、RMSE=0.087 m3; (3) the Boruta algorithm for variable screening reduced the input parameters from 64 to 52, with little difference in estimation accuracy: R2=0.87, RMSE=0.087 m3; (4) the estimation accuracy of sample plot volume was R2=0.97, RMSE=0.703 m3·ha-1. The results suggested the application potential to use the BLS point cloud for individual tree volume estimation and the sample volume by random forest algorithm.

Keywords: Volume ; Backpack laser scanning ; Random forest ; Boruta algorithm

PDF (3049KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

马超, 黄华国, 田昕, 刘炳杰, 温坤剑, 王鹏杰. 基于背包激光雷达的单木材积估测方法研究. 遥感技术与应用[J], 2022, 37(5): 1071-1083 doi:10.11873/j.issn.1004-0323.2022.5.1071

Ma Chao, Huang Huaguo, Tian Xin, Liu Bingjie, Wen Kunjian, Wang Pengjie. Research on Individual Tree Volume Estimation Using Backpack LiDAR. Remote Sensing Technology and Application[J], 2022, 37(5): 1071-1083 doi:10.11873/j.issn.1004-0323.2022.5.1071

1 引 言

森林蓄积量是指定单位面积内所有单木材积的总和,是衡量森林生态系统的重要指标之一,是制定森林经营管理方案的重要科学依据。单木材积是森林蓄积的基本单元,精确估测单木材积可进一步递推得到大尺度的森林蓄积,对森林资源管理水平的提高和生态环境保护建设都具有重要意义1。传统的森林蓄积量估测是根据国家森林资源规划设计调查技术规程,通过对样地相关因子的实际测量值,基于材积公式得到样地蓄积量。调查精度高但人力物力耗费较大,且在复杂地形作业难度更大。随着遥感技术的发展,利用遥感影像结合地面实际调查数据估测森林蓄积成为了可能。通过利用不同的卫星遥感影像数据结合少量样地调查数据,从而进行蓄积量的相关研究2-4。但光学影像仅提供水平尺度的信息,不具备森林垂直结构信息,且光谱信号容易饱和,因此利用光学影像进行森林蓄积量估测的精度普遍偏低5

激光雷达是一种主动遥感技术,它通过激光发射器向物体发射探测信号,然后接收物体反射的信号作为信息数据,克服了传统光学遥感所存在的饱和效应,可以直接获取森林三维结构信息,是获取单木参数的一种重要手段6-7。目前学者们利用激光雷达获取森林三维结构参数用于森林资源监测以及进行反演林分平均高、生物量、郁闭度的研究均取得了比传统光学遥感更高的精度8-10

地基激光雷达(Terrestrial Laser Scanning, TLS)作为现代测量的新兴技术之一被广泛应用于单木测量和森林调查的各个方面,可以获取准确的三维信息11。TLS是固定平台类地面激光雷达,在林业中最大的优势就是能够迅速、自动化、重复、无破坏的、在毫米级精度以点云的形式记录森林信息。背包式激光雷达系统(Backpack Laser Scanning, BLS)是移动平台类的地面激光雷达,目前大多数背包设备搭载的激光扫描仪测距精度在厘米级别,其数据采集精度低于毫米级别的TLS。但其优势在于能够应对复杂地形的扫描工作,扫描效率远高于多站TLS扫描,同时能够避免因林下树干间的相互遮挡导致数据不完全的问题,在森林结构参数提取方面有着巨大发展空间和应用潜力。BLS相比于TLS采集的点云数据更为完整,但在单木参数提取的精度方面没有显著优势12。目前已有学者通过改进点云匹配算法或滤波算法来提高胸径、树高参数提取的精度13-14,而使用BLS点云数据进行单木材积估测的研究较少。由于广西高峰林场中桉树林生长快、收获周期短,利用BLS可快速获取单木材积计算参数,大大降低人工野外调查成本,可作为较好的研究对象。

本研究以样地单木BLS点云数据和地面样地调查数据作为数据源,通过BLS点云所提取的单木结构参数结合高度信息,采用随机森林算法建立单木材积估测模型,同时使用Boruta算法对各类参数进行筛选,得到单木估测中的重要变量,最终确定最佳估测模型,探索背包激光雷达数据在单木材积估测应用中的潜力,为准确高效估测森林蓄积量提供依据。

2 研究区概况与数据预处理

2.1 研究区概况

以广西高峰林场界牌分场(108°21'—108°24'E,22°56'—24°00'N)作为实验研究区,该区位于广西壮族自治区南宁市兴宁区北部。地貌以低丘为主,地势西北高东南低,海拔77—463 m,坡度 5°—40°。受南亚热带季风影响,雨热同季,干湿分明,年均气温 21.6 ℃,年均降水量约 1 300 mm,降水主要集中在春季和夏季,年均蒸发量1 205—1620 mm,年均相对湿度 80% 以上。根据 2016 年森林资源二类调查数据,界牌分场经营面积 2 234.9 hm2,林地面积2 122.7 hm2,占总面积的94.98%,森林覆盖率为92.10%。主要树种有杉木(Cunninghamia lanceolataLamb.) Hook.)、巨尾桉(Eucalyptus grandis×urophylla)、马尾松(Pinus massoniana Lamb.)等。本研究的目标树种主要是桉树和杉木。研究区内森林资源丰富,是广西林区林业生产重点区域之一(图1)。研究区多为陡坡,地形复杂(表1)。

图1

图1   研究区样地分布图

Fig.1   Distribution map of sample plots in the study area


表1   样地信息汇总表

Table 1  Sample plots information summary table

样地编号

平均胸径

/(cm)

平均树高

/(m)

蓄积量

/(m3·hm-2)

单木株数坡度坡向样地类型
A124.1831.88465.39294.34桉树林
A221.8725.71341.063227.75西北桉树林
A2111.1013.91112.485827.22西南桉树林
A611.7613.78153.246144.41西南桉树林
AS115.3117.08356.586335.87西南桉树杉木混交林
AS216.2317.81389.976330.09西北桉树杉木混交林
AS322.6628.34197.721628.83桉树杉木混交林
AS512.6313.41101.802014.95桉树杉木混交林
AS712.8215.94114.484525.26西南桉树杉木混交林
S11117.7412.18157.852532.87西南杉木林
S217.9013.86182.852634.40杉木林
S324.9516.74258.342354.48西南杉木林
S522.1016.07351.774235.90西南杉木林
S627.2016.8579.30637.84西南杉木林
S717.8113.4978.771728.28西南杉木林
S818.8913.34133.152239.20西南杉木林
S925.0617.22108.041038.64杉木林

新窗口打开| 下载CSV


2.2 数据获取

2.2.1 样地调查数据

在研究区内选择17块样地,其中桉树纯林4块,杉木纯林8块,桉树杉木混交林5块。样地调查时间为2021年4月9日至5月9日,样地大小为20 m×20 m,记录的数据包括:胸径≥5 cm树木的胸径(cm)、树高(m)、东西冠幅(m)、南北冠幅(m)和枝下高(m)等。为了使单木与背包激光雷达数据在空间上能精准匹配,使用华测i90型RTK对样地内的单木进行定位,仪器定位精度为5 cm,在密林中单木定位精度有所降低但满足需求。最后统计共558棵树,将枯死树、断木以及树高或胸径偏差值过大的样本剔除后,用于实验的单木共542棵。随机抽取70%数据作为训练样本(379棵),剩余30%数据作为验证样本(163棵),样地信息如表1所示。

2.2.2 背包激光雷达数据

背包式激光雷达数据通过LiBackpack DGC50设备采集。该设备主要靠水平和垂直两个方向上的激光雷达传感器同时搭载高精度GNSS设备,利用同步定位与制图构建SLAM(Simultaneous Localization And Mapping) 技术解算得到扫描范围内高精度的三维点云数据。该设备采用自下而上的扫描方式,获取树干/枝叶详细的点云,具有扫描范围广、高效率、高精度、多平台、低成本和易操作等特点,其系统参数如表2所示。

表2   LiBackpack DGC50 背包激光雷达扫描系统

Table 2  LiBackpack DGC50 scanning system

性能指标参数性能指标参数
激光器Velodyne VLP-16×2激光波长903 nm
LiDAR精度±3 cm扫描频率600 000 pts/s
相对精度3 cm水平视场角0°—360°
绝对精度5 cm垂直视场角-90°—90°
重量9.4 kg电池5 700 mAh
尺寸908 mm×300 mm×333 mm工作时间~2 h
激光扫描距离100 m工作温度-10 ℃—50 ℃

新窗口打开| 下载CSV


使用LiBackpack DGC50设备采集研究区内17块样地的点云数据。采集时的路径规划对最终的数据质量有较大影响,合理的路径规划能采集完整信息,并减少数据冗余。针对20 m×20 m的样地,考虑树木分布比较密集,采用图2所示的路径规划(序号①—⑤为轨迹行走顺序)。

图2

图2   采集路线规划

Fig.2   Collection route planning


2.3 数据预处理和建模流程

在数据预处理阶段,首先对获取的样地点云进行去噪、地面点分类以及单木分割。再与样地数据进行几何配准,将点云坐标与单木定位坐标匹配。分割单木点云,提取单木特征变量和分层高度变量,采用随机森林算法建模并进行精度评价。具体流程如图3所示。

图3

图3   单木材积估算流程图

Fig.3   Flow chart of individual tree stock volume estimation


2.4 数据预处理
2.4.1 样地单木材积计算

研究的目标树种主要是桉树和杉木,其中桉树292棵,杉木161 棵,其他阔叶树种89棵。依据二元材积公式计算单木材积,具体公式如下:

桉树: V=0.0434785-0.00675245D+0.000273652D2+0.000502044DH+0.0000154609D2H-0.0033291H(D>8cm)
V=0.000126803D2.00698(DlgD)-0.02876H0.171793(HlgH)0.318743(6D8cm)
杉木: V=0.000065671D1.769412H1.069769
其他阔叶树种: V=0.0000667054D1.8479545H0.96657509

其中:V为单木材积(m3);D为单木胸径(cm);H为单木树高(m);材积公式依据《中国立木材积表》广西桉树二元带皮材积表、广西杉木二元立木材积表以及广西阔叶树二元立木材积表。

2.4.2 背包激光雷达点云数据预处理

使用LiFuser-BP软件对背包点云数据进行拼接,检查点云质量,确认合格后用LiDAR360软件进行预处理。再利用LiDAR360软件对单木进行分割,并获取单木结构特征参数。具体流程如下:

(1)去噪:常见的噪点主要包括高位粗差(空中点)和低位粗差(地表以下的点)。通过对这两类以及孤立点进行分类并去除,以提高点云质量。算法原理:对每一个点搜索指定个数的领域点,计算每个点到领域点的平均值,统计距离平均值的中值和标准差,将距离平均值大于最大距离(最大距离=中值+标准差倍数×标准差)的点视为噪点剔除,此处标准差倍数设置为5。

(2)地面点滤波:采用改进渐进加密三角网滤波算法进行地面点分类15

(3)地面点归一化:基于地面点进行归一化,获得单木数据相对高度,以减少地形因素对单木高度估测的影响16

2.4.3 点云单木特征变量提取

对地面点归一化后的点云数据使用点云分割单木的算法提取单木点云17。该算法从一个设定种子点开始,根据临界值和最小间距规则,对更低点进行估计,将该种子点发展为一个树聚类。再通过分析点的高程值以及与其他点之间距离,以确定单木,同时依据单木分割结果,将每棵树的单株点云提取出来,得到542组单木点云数据;并获取单木胸径(DBH)、树高(H)、冠幅直径(CD)、冠幅面积(CA)、冠幅体积(CV)等5种单木尺度的特征变量。利用单木点云绝对坐标与地面测量时单木定位RTK坐标,将单木点云与样地实测数据进行匹配。此外,根据单木点云提取郁闭度(CC)18、间隙率(GF)19和叶面积指数(LAI)20等3种特征变量,最终得到8个单木特征变量。

2.4.4 点云分层高度特征变量提取

利用LiDAR 360软件计算单木点云的一系列结构参数,其中高度变量的相关参数是基于点云高程值来计算与高程相关的46个统计参数,以及与密度相关的10个参数,共计56个分层高度特征变量。具体是将点云依照指定高度间隔分割成不同的层,统计各层点云信息。可直接通过统计点云计算得到的参数有: 中位数的绝对中位差(Hmm)、最大值(Hmax)、最小值(Hmin)、平均值(Hmean)、中位数(Hmedian)、标准差(Hstd)、方差(Hvar)、累积高度百分位数(HAIH%)、高度百分位数(H%)和密度变量(DM)等10类变量。其中累积高度百分位数(HAIH%)的统计方法是将某一统计单元内所有归一化的激光雷达点云按高度进行排序并计算所有点的累积高度,每一统计单元内X%的点所在的累积高度,即为该统计单元的累积高度百分位数,包含15个:HAIH1%、HAIH5%、HAIH10%、HAIH20%、HAIH25%、HAIH30%、HAIH40%、HAIH50%、HAIH60%、HAIH70%、HAIH75%、HAIH80%、HAIH90%、HAIH95%和HAIH99%;高度百分位数(H%)的统计方法是将某一统计单元内所有归一化的激光雷达点云按高度进行排序,然后计算每一统计单元内X%的点所在的高度,即为该统计单元的高度百分位数,包含15个:H1%、H5%、H10%、H20%、H25%、H30%、H40%、H50%、H60%、H70%、H75%、H80%、H90%、H95%和H99%;密度变量(DM)的统计方法是将点云数据从低到高分成10个相同高度的切片,每层回波数的比例就是相应的密度变量,共包含10个:DM0、DM1、DM2、DM3、DM4、DM5、DM6、DM7、DM8和DM9。其他高度变量的计算公式如表3所示。

表3   高度变量的计算公式

Table 3  Calculation formula of height variable

变量名称含义计算公式
Hcv变异系数Hcv=(Hstd/Hmean)×100% (5)
Hadd平均绝对偏差Haad=1ni=1nZi-Hmean (6)
Hcrr冠层起伏率Hcrr=(Hmean-Hmin)/(Hmax-Hmin) (7)
HAIHIQR累积高度百分位数四分位数间距HAIHIQR=HAIH75%-HAIH25% (8)
HIQR高度百分位数四分位数间距HIQR=H75%-H25% (9)
Hsq二次幂平均Hsq=(i=1nZi2)/n (10)
Hcmc三次幂平均Hcmc=(i=1nZi3)/n3 (11)
Hk峰度Hk=i=1n(Zi-Hmean)4(n-1)Hstd4 (12)
Hske偏斜度(偏态)Hk=i=1n(Zi-Hmean)3(n-1)Hstd3 (13)

注:上式中Zi 为第i个点的高程值,n为统计单元内点个数。

新窗口打开| 下载CSV


3 研究方法

蓄积量模型的构建有参数化法和非参数化法两种21。参数化法是用有限数量的参数定义或建立参数化的模型,此方法需要做出一些先验假设,且测试数据不可违反假设,必要时需要对变量进行适当转换。优点在于此方法可以较好地解释变量与待测参数之间的生理生化关系,但其不足之处在于对每一组新的数据需要构建新的模型。非参数化法不能得出具体模型表达,无需先验假设,但不影响回归预测,且预测精度往往高于线性回归22。本研究利用随机森林算法构建估测单木材积的非参数化模型。

3.1 随机森林模型

随机森林算法(Random Forest, RF)是由Breiman在2001年提出的,是以Bagging集成学习算法和随机空间算法为基础的机器学习算法23。基本思想是基于统计学理论提出的,通过Bootstrap算法进行重采样,从原始训练样本集N中有放回地重复随机抽取K个样本生成新的训练样本集合,然后根据自助样本集生成K个决策树组成的随机森林。此外,每棵树可用的预测变量是随机选择的,而且数量受到限制。由于并非所有变量都同时考虑,在随机森林模型中,通常可以忽略预测因子之间的多重共线性问题。

在随机森林模型中,需要设置的参数有决策树数目(ntree)和节点分裂时变量个数(mtry)。决策树数目为重抽样次数,一般当决策树数目大于500以后整体误差率趋于稳定,但为保障预估结果的可靠性且不会影响计算效率,决策树数目需要依据具体数据而定。节点分裂时变量个数指的是每次寻找最佳分割效果时从全部自变量中随机选取的变量数,一般对于回归问题,变量个数默认值设置为全部自变量数目的三分之一。本研究利用R语言中的Random Forest包,通过参数调整与优化筛选确定合适的决策树数目(ntree)和节点分裂时变量个数(mtry),并代入随机森林回归模型,使用验证样本进行模型预估。

3.2 变量筛选

如何进行特征参数的筛选是构建回归模型的关键问题24。模型构建的过程中,变量个数越多,运算量越大,所耗费的时间也越长,因此需要对变量进行有效的筛选,使其在保证模型精度的情况下降低运算量。本研究通过R语言中Boruta包进行参数调整,该算法的思想是:将原始特征集(real features, 简称R)通过随机打乱顺序重新组合的方法生成阴影特征(shadow features, 简称S),将原始特征集与阴影特征拼接作为特征矩阵进行训练,最后以阴影特征的特征重要性(feature importance)得分作为参考基准, 从原始特征集中选出与因变量真正相关的特征集合。Boruta算法主要目标是将与因变量相关性差的特征从原始特征集中剔除23

3.3 模型精度评价

研究以决定系数(Coefficient of Determination,R2)和均方根误差(Root Mean Square Error,RMSE)作为预测模型的基本评价指标。具体计算公式如下:

R2=1-i=1n(yi-y^i)2/i=1n(yi-y¯)2
RMSE=1ni=1n(yi-y^i)2

其中: yi为样地实测值;y^i为模型估计值;y¯为实际测量值均值;n为训练或验证样本数量。

4 实验结果

本研究共构建三次材积模型,第一次仅使用8个单木特征变量进行建模,记为模型1;第二次将单木特征变量与分层高度变量联合(共计64个变量)进行建模,记为模型2;第三次利用Boruta算法进行变量筛选(筛选后变量52个),优化模型2,得到模型3。

4.1 单木材积模型建立

模型1:将点云提取的单木特征变量代入随机森林,输入模型的单木特征变量如表4所示。

表4   输入单木结构变量

Table 4  Input individual tree structure variable

序号变量名称含义
1Htree通过点云提取的单木树高
2DBH点云提取的单木胸径
3CD通过点云提取的单木冠幅直径
4CA通过点云提取的单木冠幅面积
5CV通过点云提取的单木冠幅体积
6CC郁闭度
7GF间隙率
8LAI叶面积指数

新窗口打开| 下载CSV


随机森林回归模型的建模效果除了受输入变量的影响外还受ntree和mtry这两个重要参数的影响,其中ntree默认为500;mtry默认为logN,mtry默认情况下不一定得到最优模型,选择合适的mtry值可以有效的提高模型的精度25,此处利用循环确定最优值, 参与计算的变量有8个,因此建立8个模型,选择mtry参数最优值,1≤mtry≤8。图4为8个模型的评价指标。

图4

图4   模型1评估指标

Fig.4   Evaluation indicators of model 1


图4所示,RMSE随着mtry增加而不断减小,R2随着mtry增加而增加。选择RMSE最小、R2最大时的mtry =8作为最优建模参数,此时模型的ntree参数取600,误差趋于稳定(图5)。确定最优参数后(mry=8,ntree=600),进行建模。模型的预测精度如图6所示,最终训练数据中模型精度为R²=0.96、RMSE=0.042 m3;验证数据的评估指标为R²=0.83、RMSE=0.097 m3

图5

图5   模型1 ntree最优值确定

Fig.5   Optimal ntree Parameter of model 1


图6

图6   模型1单木材积估测结果

Fig.6   Estimation individual tree stock volume with model 1


4.2 输入分层高度变量并筛选

联合单木结构特征变量和分层高度变量进行建模,参与计算的变量共64个,通过Boruta算法进行变量筛选,可确定对单木材积影响较大的变量,并剔除无关变量,减轻了运算量、提高了建模效率。经Boruta算法筛选后首先得到各个变量重要性盒状图(图7),其中蓝色盒状图为阴影特征集最小、平均和最大的Z分数,红色、黄色和绿色的盒状图分别代表拒绝、不确定和确定变量的Z分数。第一次筛选得到确定变量49个,不确定变量10个,拒绝变量5个。将结果再次筛选,确定变量52个,拒绝变量12个,即筛选出52个变量用于建模。筛选得到的输入变量如表5所示,变量的重要性排序如图8所示。

图7

图7   变量重要性盒状图

Fig.7   Box plot of variable importance


表5   变量筛选结果

Table 5  Results of variable filtering

输入变量名变量含义变量个数输入变量名变量含义变量个数
CC郁闭度1HIQR高度百分位数四分位数间距1
LAI叶面积指数1Hk峰度1
Hmm中位数绝对偏差的中位数1Hske偏斜度(偏态)1
Hmax最大值1HAIHIQR累积高度百分位数四分位数间距1
Hmean平均值1DBH单木胸径1
Hmedian中位数1Htree树高1
Hstd标准差1CD冠幅直径1
Hvar方差1CA冠幅面积1
Hz平均绝对偏差1CV冠幅体积1
Hcrr冠层起伏率1DM

密度变量

拒绝DM1和DM3

8
Hsq二次幂平均1H%

高度百分位数

拒绝H1%和H5%

13
Hcmc三次幂平均1HAIH%

累积高度百分位数

拒绝HAIH1%,HAIH5%,HAIH10%,HAIH20%,HAIH30%和HAIH40%

9
Hcv变异系数1

新窗口打开| 下载CSV


图8

图8   筛选后变量的重要性排序

Fig.8   The importance of filtering variables


4.3 确定最优模型

联合单木结构特征变量和分层高度变量(64个特征变量)进行建模,得到模型2;筛选变量后进行建模(52个特征变量),得到模型3。对比筛选前后的建模结果(图9),模型2和模型3的建模结果相差无几。两者都选择RMSE最小、R2最大时的mtry,模型2构建的最优mtry=43;模型3构建的最优mtry=38。此时再确定各个模型ntree的最优值(图10),都取ntree=400。图11图12分别给出了二者最优随机森林模型在训练和验证中的精度,其中模型2训练的估测精度为R²=0.97、RMSE=0.034 m3;验证数据的精度为R²=0.87、RMSE=0.087 m3。模型3训练的估测精度为R² = 0.97、RMSE=0.037 m3;验证数据的精度为R² = 0.87、RMSE=0.087 m3

图9

图9   建模的评估指标

Fig.9   Evaluation indicators of modeling


图10

图10   建模ntree最优参数确定

Fig.10   Optimal ntree parameter of modeling


图11

图11   模型2单木材积估测结果

Fig.11   Estimation individual tree stock volume with Model 2


图12

图12   模型3单木材积估测结果

Fig.12   Estimation individual tree stock volume with Model 3


对比两种情况下的建模情况可知,经Boruta算法筛选后的52个特征变量进行建模(模型3),模型的R²、RMSE没有降低,同时去除了无关变量,提高了建模效率。

对比添加高度变量前后的建模结果(图5图11),训练样本的各项评估指标中添加高度变量后模型R²提高了0.01、RMSE降低了0.005 m3,测试样本模型R²提高了0.05、RMSE降低了0.01 m3。可见添加高度变量后模型在训练样本和测试样本中的精度均有明显提升。最终确定最优变量选择方案为使用经Boruta筛选后的52个变量作为输入参数进行建模。

为验证模型稳定性,将样本50%作为训练数据,50%作为验证数据,以最优模型进行建模,得到结果为训练数据的R2=0.95,RMSE=0.051 m3;验证数据的R2=0.78,RMSE=0.106 m3,精度对比70%训练,30%验证的结果有所降低,原因可能是训练集的减少导致的。本研究还将数据集分成10份,轮流将其中9份作为训练数据,1份作为测试数据,重复10次进行交叉验证。十折交叉验证的结果如表6图13所示。由表6得到训练数据的R2平均值为0.98,RMSE平均值为0.036 m3图13中训练数据的R2=0.98,RMSE=0.036 m3图12中训练结果基本一致;表6中验证数据的R2平均值为0.85,RMSE平均值为0.087 m3图13中验证数据的R2=0.85,RMSE=0.089 m3图12的验证结果基本一致。说明使用随机森林构建的单木材积估测模型具有很好的稳定性。

表6   十折交叉验证建模结果

Table 6  Results of Ten-fold modeling

建模训练结果建模验证结果
序号R2RMSE/(m3)序号R2RMSE/(m3)
10.980.03610.860.086
20.980.03620.870.088
30.980.03630.810.096
40.980.03440.810.118
50.980.03650.820.091
60.970.03760.910.072
70.980.03670.860.077
80.980.03680.850.09
90.980.03690.860.083
100.980.036100.890.078

新窗口打开| 下载CSV


图13

图13   十折交叉验证建模结果

Fig.13   Results of Ten-fold modeling


4.4 样地蓄积量估测

利用最优随机森林材积估测模型估测的单木材积求和可得到每个样地的蓄积量,结果如表7所示。其中大部分样地实测与估值差距小,说明估测精准;但有些样地,如A21、S111等,实测与估值差值较大,结合表1发现主要集中在西南坡向以及坡度大于30°地区。这些样地林下植被茂密,地形复杂,导致估测精度较低。最终得到样地估测精度R2=0.97、RMSE=0.703 m3·ha-1

表7   样地蓄积量估测

Table 7  Sample field volume estimation

样地编号

实测蓄积量

/(m3·hm-2)

模型估测蓄积量

/(m3·hm-2)

实测与估测蓄积量之差

/(m3·hm-2)

A1465.39456.918.48
A2341.06341.75-0.69
A21112.48151.40-38.92
A6153.24172.97-19.73
AS1356.58375.63-19.05
AS2389.97407.07-17.1
AS3197.72197.290.43
AS5101.8089.5012.3
AS7114.48142.61-28.13
S111157.85133.8923.96
S2182.85184.52-1.67
S3258.34241.7816.56
S5351.77328.8522.92
S679.3063.2916.01
S778.7774.514.26
S8133.15132.890.26
S9108.04102.065.98

新窗口打开| 下载CSV


5 讨 论

利用背包激光雷达系统获取的点云提取单木参数,并用随机森林算法基于其提取的不同变量进行建模,模型精度较高,说明随机森林模型在单木材积估测的应用中有很好的适应性。对比不同抽样方式的建模(如以70%作为训练,30%作为验证;以50%作为训练,50%作为验证进行)结果,发现以70%进行训练的模型精度更高,说明训练样本量越大模型精度越高。仅用单木特征参数参与建模,模型的估测精度为R²=0.83、RMSE=0.097 m3。添加高度变量并通过Boruta算法进行变量筛选后,最终得到的模型精度有了进一步的提升:R²=0.87、RMSE=0.087 m3。说明基于BLS点云估测单木材积时,添加高度变量可有效提高模型预测精度。

采用背包激光雷达系统获取点云进行单木尺度的特征变量进行蓄积量估测的优势主要包括3个方面:①相比于只能获得林分水平结构信息的传统光学遥感影像,激光雷达穿透能力更强,能够获取更准确的林分垂直结构的信息,而垂直结构信息能提高对森林蓄积量的估测精度26。例如,Hu等27利用机器学习和多元线性回归基于哨兵2号光学影像估测森林蓄积量的精度为R2=0.58、RMSE=65.03 m3·hm-2。②相比于大尺度的机载激光雷达数据,背包点云估测单木材积的适用性更强。孙忠秋等28基于机载激光雷达点云数据联合随机森林算法估测我国东北部森林蓄积量,估测精度为R²=0.79、RMSE=36.23 m3·hm-2,但其模型受研究区地形和森林结构的影响较大;地形较为复杂地区,庞勇等29对大湄公河次区域森林生物量估测的建模估测相关系数为0.7;曹林等30在江苏常熟虞山林场采用逐步回归估算森林蓄积量,模型结果的决定系数为0.55。③相比于固定平台类地面激光雷达,背包式激光雷达系统能够应对复杂地形的扫描工作,扫描速度比多站TLS扫描更快,减少了TLS扫描需要多站测量、拼接的工作量,具有更出色的通过性和测量效率12

在单木特征参数提取精度方面,BLS点云数据与TLS相比还有一定差距,主要原因是:①BLS所用的激光扫描器的扫描精度通常是厘米级,无法达到TLS毫米级的精度;②点云数据拼接造成的误差,林下由于没有GPS信号,只能使用SLAM算法进行数据拼接,而目前针对复杂森林场景的SLAM算法精度还有待提升;③当激光传感器与被测物距离较远时,惯性测量单元所计算出的位移会被放大,使得BLS采集距离较远目标数据时误差较大。而通过点云提取的参数精度高低直接决定了模型估测精度,目前提高BLS点云提取单木参数精度的方法主要是通过改进点云匹配算法、点云滤波算法等手段13-14。此外激光雷达点云可提取的特征变量包括不同分位数的高度、不同分位数的点云密度,不同分位数的点云强度和最大回波高度等,不同的研究选择的变量不尽相同。本研究通过BLS直接提取的单木参数与高度参数结合进行模型构建,将随机森林算法直接用于单木材积估测。结果表明结合合理的变量选择可以有效提高单木材积估测精度,说明BLS获取的单木点云数据可以用于单木尺度相关参数提取与估算的研究。

6 结 论

本研究基于背包激光雷达数据提取单木尺度的林木参数和点云分层高度变量,结合地面样地实测调查数据,采用随机森林回归算法构建单木材积估测模型。结果表明仅用单木结构特征变量进行建模可估算单木材积且精度较高:R²=0.83、RMSE=0.097 m3;联合单木结构特征变量和分层高度变量后,材积估测精度R²有了进一步提升达到0.87;通过Boruta算法筛选后,既保证了模型精度又提高了建模效率。说明基于BLS点云数据进行单木材积的估测是可行的,且通过联合单木参数和高度参数的方法可有效提高估测精度。同时本文的研究区中的样地平均坡度在30°以上,说明BLS点云数据可应用于估测复杂陡坡山地的单木材积。

参考文献

Yan Fei.

Research of technology and method of forest resource inventory

[D]. BeijingBeijing Forestry University2014.

[本文引用: 1]

闫飞.

森林资源调查技术与方法研究

[D]. 北京北京林业大学2014.

[本文引用: 1]

Wang JinliangCheng FengWang Chenget al.

Primary discussion on the potential of forest volume estimating using ICESat-GLAS data in complex terrain area: A case study of Shangri-la, Yunnan Province

[J]. Remote Sensing Technology and Application, 2012271):45-50.

[本文引用: 1]

王金亮程峰王成.

基于ICESat-GLAS数据估算复杂地形区域森林蓄积量潜力初探——以云南香格里拉县为例

[J]. 遥感技术与应用, 2012271):45-50.

[本文引用: 1]

Gang CHay G JSt-Onge B.

A GEOBIA framework to estimate forest parameters from LiDAR transects, QuickBird imagery and machine learning: A case study in Quebec, Canada

[J]. International Journal of Applied Earth Observations and Geoinformation, 20121528-37.

Liang ZhifengLing FeilongWang Xiaoqin.

Correlation analysis between L-band SAR and forest stem volume in Northeast China

[J]. Remote Sensing Technology and Application,2013285):871-878.

[本文引用: 1]

梁志锋凌飞龙汪小钦.

L波段SAR与中国东北森林蓄积量的相关性分析

[J]. 遥感技术与应用, 2013285):871-878.

[本文引用: 1]

Li ShiboLin HuiWang Guangminget al.

Estimation of forest volume based on GF-1

[J]. Journal of Central South University of Forestry and Technology, 2019398):70-7586.

[本文引用: 1]

李世波林辉王光明.

基于GF-1的森林蓄积量遥感估测

[J]. 中南林业科技大学学报, 2019398):70-7586.

[本文引用: 1]

Pearse G DMorgenroth JWatt M Set al.

Optimising prediction of forest leaf area index from discrete airborne LiDAR

[J]. Remote Sensing of Environment,20172003):220-239.

[本文引用: 1]

Bian RuiYanyun NianGou Xiaohuaet al.

Analysis of forest canopy height based on UAV LiDAR: A case study of Picea Crassifolia in the east and central of the Qilian Mountains

[J]. Remote Sensing Technology and Application, 2021363):511-520.

[本文引用: 1]

边瑞年雁云勾晓华.

基于无人机激光雷达的森林冠层高度分析

[J]. 遥感技术与应用, 2021363):511-520.

[本文引用: 1]

Li WenjuanZhao ChuanyanBie Qianget al.

Retrieval of the forest structural parameters using airborne LiDAR data

[J]. Remote Sensing Technology and Application,2015305):917-924.

[本文引用: 1]

李文娟赵传燕别强.

基于机载激光雷达数据的森林结构参数反演

[J].遥感技术与应用,2015305):917-924.

[本文引用: 1]

Tang Xuguang.

Estimation of forest aboveground biomass by integrating ICESat/GLAS waveform and TM data

[D]. ChangchunGraduate University of Chinese Academy of Sciences (Northeast Institute of Geography and Agroecology)2013.

汤旭光.

基于激光雷达与多光谱遥感数据的森林地上生物量反演研究

[D]. 长春中国科学院研究生院(东北地理与农业生态研究所)2013.

Zhao XunYue CairongLi Chunganet al.

Estimation of forest canopy density based on airborne LiDAR point cloud data

[J]. Remote Sensing Technology and Application, 2020355):1136-1145.

[本文引用: 1]

赵勋岳彩荣李春干.

基于机载LiDAR点云数据森林郁闭度估测

[J]. 遥感技术与应用, 2020355):1136-1145.

[本文引用: 1]

Wang XiangyuXie DonghuiWang Yanet al.

3D reconstruction of an individual tree from terrestrial laser scanner data

[J]. Remote Sensing Technology and Application, 2015303):455-460.

[本文引用: 1]

王向玉谢东辉汪艳.

基于地面激光雷达点云数据的单木三维重建

[J]. 遥感技术与应用, 2015303):455-460.

[本文引用: 1]

Cai Shuo.

Extraction of tree diameter at breast height based on terrestrial laser scanning and backpack baser scanning

[D]. HarbinNortheast Forestry University2021.

[本文引用: 2]

蔡硕.

基于地基激光雷达和背包式激光雷达林木胸径提取

[D]. 哈尔滨东北林业大学2021.

[本文引用: 2]

Cai ShuoXing YanqiuDuanmu jialonget al.

Extraction of DBH from filtering out low intensity point cloud by backpack laser scanning

[J]. Forest Engineering, 2021375):12-19.

[本文引用: 2]

蔡硕邢艳秋端木嘉龙.

背包式激光雷达滤除低强度点云提取林木胸径

[J]. 森林工程, 2021375):12-19.

[本文引用: 2]

Duanmu jialong.

A study of planted forest DBH estimation algorithms using backpack laser scanning data

[D]. HarbinNortheast Forestry University2020.

[本文引用: 2]

端木嘉龙.

基于背包激光雷达数据的人工林林木胸径提取算法研究

[D]. 哈尔滨东北林业大学2020.

[本文引用: 2]

Xza BQga CYs Cet al.

Improved progressive TIN densification filtering algorithm for airborne LiDAR data in forested areas

[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 201611779-91.

[本文引用: 1]

Lee HSlatton K CRoth B Eet al.

Adaptive clustering of airborne LiDAR data to segment individual tree crowns in managed pine forests

[J]. International Journal of Remote Sensing, 2010311):117-139.

[本文引用: 1]

Li WGuo QJakubowski M Ket al.

A new method for segmenting individual trees from the LiDAR point cloud

[J]. Photogrammetric Engineering and Remote Sensing, 2012781):75-84.

[本文引用: 1]

Qin MSu YGuo Q.

Comparison of canopy cover estimations from airborne LiDAR, aerial imagery, and satellite imagery

[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2017109):4225-4236.

[本文引用: 1]

Richardson J JMonika Moskal LKim S H.

Modeling approaches to estimate effective Leaf Area Index from aerial discrete-return LiDAR

[J]. Agricultural and Forest Meteorology, 20091496-7):1152-1160.

[本文引用: 1]

Li YGuo QTao Set al.

Derivation, validation, and sensitivity analysis of terrestrial laser scanning-based leaf area index

[J]. Canadian Journal of Remote Sensing, 2016426):719-729.

[本文引用: 1]

Shao ZZhang LWang L.

Stacked sparse autoencoder modeling using the synergy of airborne LiDAR and satellite optical and SAR data to map forest above-ground biomass

[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 20171012):5567-5582.

[本文引用: 1]

Garcia-Gutierrez JMartinez-Alvarez FTroncoso Aet al.

A comparison of machine learning regression techniques for LiDAR-derived estimation of forest variables

[J]. Neurocomputing, 20151671):24-31.

[本文引用: 1]

Breiman L.

Random forests

[J]. Machine Learning, 2001455-32.

[本文引用: 2]

Franklin J.

The elements of statistical learning: Data mining, inference and prediction

[J]. The Mathematical Intelligencer, 2005272):83-85.

[本文引用: 1]

Qiangxin OuLei XiangdongShen Chenchenet al.

Individual tree DBH growth prediction of larch-spruce-fir mixed forests based on random forest algorithm

[J]. Journal of Beijing Forestry University,2019419):9-19.

[本文引用: 1]

欧强新雷相东沈琛琛.

基于随机森林算法的落叶松-云冷杉混交林单木胸径生长预测

[J]. 北京林业大学学报,2019419):9-19.

[本文引用: 1]

Lim KTreitz PWulder Met al.

LiDAR remote sensing of forest structure

[J]. Progress in Physical Geography, 2003271):88-106.

[本文引用: 1]

Hu YXu XWu Fet al.

Estimating forest stock volume in Hunan Province, China, by integrating in situ plot data, Sentinel-2 images, and linear and machine learning regression models

[J]. Remote Sensing,2020121):186. DOI:10.3390/rs 12010186 .

[本文引用: 1]

Sun ZhongqiuGao JinpingWu Fayunet al.

Estimating forest stock volume via small-footprint LiDAR point cloud data and random forest algorithm

[J]. Forestry Science, 2021578):68-81.

[本文引用: 1]

孙忠秋高金萍吴发云.

基于机载激光雷达点云和随机森林算法的森林蓄积量估测

[J]. 林业科学, 2021578):68-81.

[本文引用: 1]

Pang YongHuang KebiaoLi Zengyuanet al.

Forest aboveground biomass analysis using remote sensing in the Greater Mekong Subregion

[J]. Resources Science, 20113310):1863-1869.

[本文引用: 1]

庞勇黄克标李增元.

基于遥感的湄公河次区域森林地上生物量分析

[J]. 资源科学, 20113310):1863-1869.

[本文引用: 1]

Cao LinDai JinsongXu Jianxinet al.

Optimized extraction of forest parameters in subtropical forests based on airborne small footprint LiDAR technology

[J]. Journal of Beijing Forestry University, 2014365):13-21.

[本文引用: 1]

曹林代劲松徐建新.

基于机载小光斑LiDAR技术的亚热带森林参数信息优化提取

[J]. 北京林业大学学报, 2014365):13-21.

[本文引用: 1]

/