img

官方微信

遥感技术与应用, 2023, 38(4): 990-1002 doi: 10.11873/j.issn.1004-0323.2023.4.0990

遥感应用

基于机器学习的棚户区识别应用——以上海棚户区为例

徐丹,1, 林文鹏,1,2, 马帅1

1.上海师范大学 环境与地理科学学院,上海 200234

2.上海长三角城市湿地生态系统国家野外科学观测研究站,上海 200234

Application on Slum Identification Using Machine Learning Methods: A Case Study of Shanghai Slums

XU Dan,1, LIN Wenpeng,1,2, MA Shuai1

1.School of Environmental and Geographical Sciences,Shanghai Normal University,Shanghai 200234,China

2.Yangtze River Delta Urban Wetland Ecosystem National Field Observation and Research Station,Shanghai 200234,China

通讯作者: 林文鹏(1973-),男,福建漳浦人,教授,博士生导师,主要从事城市生态与环境遥感研究。E⁃mail: linwenpeng@shnu.edu.cn

收稿日期: 2022-04-18   修回日期: 2023-07-11  

基金资助: 上海市自然科学基金项目.  23ZR1446700
国家自然科学基金项目.  41730642.  41571047

Received: 2022-04-18   Revised: 2023-07-11  

作者简介 About authors

徐丹(1993-),女,福建建阳人,博士研究生,主要从事环境演变与风险管理研究E⁃mail:1000497916@smail.shnu.edu.cn , E-mail:1000497916@smail.shnu.edu.cn

摘要

精准获取并识别棚户区的空间分布及形态,对改善人居环境、优化城市空间结构具有重要意义。传统的实地调查方法耗时费力,以上海杨浦区南部的棚户区为例,从高空间分辨率影像中提取光谱、纹理和结构特征作为输入数据,提出了基于机器学习算法的高分遥感影像的棚户区提取方法。首先,综合比较最近邻(KNN)、逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)、集成学习(EL)5种机器学习识别方法的适用性,确定最优分类器。其次,基于网格(50m×50m)对高分影像进行特征提取,并对特征网格分类、构建分类图像特征数据集。最后,通过图像特征进行棚户区识别,并评估5种机器学习算法在城市地区识别棚户区的能力及应用。结果表明:监督机器学习方法在提取棚户区的精度方面基本能够满足棚户区的研究及实际应用,但综合考量分类结果、分类精度和运行效率,EL算法Kappa系数为73.0%、总体精度为97.27%、召回率为79.02%,均高于其它算法,且漏分错误最少,能够更加完整、准确地完成棚户区信息提取。当考虑运行效率时,LR算法识别速度明显高于其它算法,更适用于大范围棚户区的使用需求。监督学习识别方法不仅可应用于高分影像特征识别,在遥感监测、城市规划和测绘等方面也具有较大的应用潜力。

关键词: 高分遥感影像 ; 棚户区 ; 机器学习 ; 支持向量机 ; 集成学习

Abstract

Accurately extracting and identifying the spatial distribution and form of slum is of great significance to improving the living environment and optimizing urban spatial structure. Traditional field investigation methods are time-consuming and laborious. As slums in the southern Yangpu District of Shanghai as the study area, spectral, textural and structural features from high-resolution remote sensing images as input data, this paper proposed an identification method for the slum using Machine Learning (ML) algorithms. Firstly, K-Nearest Neighbor (KNN), Logistic Regression(LR), Support Vector Machine(SVM), Random Forest (RF) and Ensemble Learning(EL) algorithms were compared comprehensively to determine the optimal classifier. Secondly, features were extracted from high-resolution images based on the grid of 50 m×50 m. Then the feature grid was classified and the feature dataset was constructed. Finally, the slum area was identified by image features, and the ability and application of five ML methods in urban area are evaluated. Results showed that supervised machine learning methods could basically meet the research and practical application of slums identification. In terms of the classification results, classification accuracy and operation efficiency, the Kappa coefficient of EL algorithm was 73.0%, the overall accuracy was 97.27%, and the recall rate was 79.02%, which were all higher than other algorithms, and the omission errors were the least. Therefore, the EL algorithm could complete the information extraction of slums more completely and accurately. When considering the operating efficiency, the LR algorithm had a higher identification speed than other algorithms and was more suitable for the use of a large range of slums. Moreover, ML methods could not only be used for features extracting in high-resolution images, but also had great application potential in remote sensing monitoring, urban planning and mapping.

Keywords: High-resolution remote sensing image ; Slum ; Machine learning ; Support vector machine ; Ensemble learning

PDF (8914KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

徐丹, 林文鹏, 马帅. 基于机器学习的棚户区识别应用——以上海棚户区为例. 遥感技术与应用[J], 2023, 38(4): 990-1002 doi:10.11873/j.issn.1004-0323.2023.4.0990

XU Dan, LIN Wenpeng, MA Shuai. Application on Slum Identification Using Machine Learning Methods: A Case Study of Shanghai Slums. Remote Sensing Technology and Application[J], 2023, 38(4): 990-1002 doi:10.11873/j.issn.1004-0323.2023.4.0990

1 引 言

棚户区是指城市中缺少规划,功能和居住环境较差的、居住拥挤的房屋集中区1。快速的城镇化和经济发展的同时,中国城市的外来人口规模逐渐增大,社会融合水平的差异使得“棚户区”、“城中村”等问题更加突出2。联合国在《第三个发展十年国际发展战略》中提出发展中国家应制定政策提供“基本住房和基础设施保障”,确保在经济发展过程中能够长期不发生环境方面的问题、保持生态平衡3。《2030年可持续发展议程》中确立的17项可持续发展目标(Sustainable Development Goal, SDG)中,首次将城市和人类住区作为独立目标(SDG11: 建设包容、安全、有抵御灾害能力和可持续的城市和人类住区)纳入到全球发展战略中4-5。复杂多样的棚户区不仅阻碍了城市的发展规划,对实现可持续的城市和人类住区提出了更大的挑战。因此,精准识别这些复杂的棚户区并监控其空间分布变化是优化城市空间结构、改善人居环境的重要前提。

传统的棚户区空间信息的获取方法是通过现场勘测和实地调研,但这些方法耗费大量的人力和物力,且成本高、效率低6。而高空间分辨率的遥感影像(简称“高分影像”)精度高、实时性强,成为自动提取棚户区空间信息的重要渠道,已有大量学者使用高分影像开展了许多获取和识别棚户区和城中村信息的工作7。早期的提取方法是通过高分影像直接进行目视解译,但该方法需要丰富的预判经验,耗时长、难度高。Hofman使用面向对象的图像分析方法(Object Based Image Analysis, OBIA)从QuickBird影像中快速地提取出棚户区的空间信息8,OBIA不仅可以创建合适的分割尺度作为分类的基本单元,还可以精准保留地物边界、识别复杂的整体区域,成为当时提取棚户区或城中村的重要方法79-10。但城市中棚户区的内部结构和形状大小各不相同,OBIA方法很难兼顾复杂多变的尺度特征。随着多源数据融合技术的发展,数据融合成为突破单一数据局限、弥补社会经济属性的关键手段11。赵云涵等12借助社交媒体与兴趣点(Point of Interest, POI)数据高效识别了广州天河区的城中村信息,正确率高于89%;崔成等13则提出了融合GF-2高分影像和百度街景数据的识别方法,精度达到96.1%。随着机器学习(Machine Learning, ML)方法的飞速发展,最近邻(K-Nearest Neighbor, KNN)、逻辑回归(Logistic Regression, LR)、支持向量机(Support Vector Machine, SVM)、随机森林(Random Forest, RF)、卷积神经网络(Convolutional Neural Network, CNN)、集成学习(Ensemble Learning, EL)等算法在识别棚户区的分类工作中得到广泛应用14-17,与OBIA方法相比,这些机器学习算法不仅能够结合地物的纹理、光谱和结构等特征,而且能在单个像素级别上,达到最佳分类结果,提高分类的准确性。在基于多源数据融合的高分影像中,机器学习算法在识别其棚户区和城中村的空间信息工作中发挥巨大作用18-19。因此,将高分影像和机器学习算法相结合,是棚户区识别应用中的重要方法。

综上,以上海市杨浦区南部的棚户区为例,利用Google Earth平台提供的高分影像数据,分析比较最近邻(KNN)、逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)、集成学习(EL)5种主要的机器学习算法,根据研究区的空间特征和实地情况,综合考量各类算法在分类结果、分类精度和运行效率方面的适用性,探究其最佳性能,为机器学习算法在棚户区的识别应用提供参考,以期为城市未来的发展规划和决策提供科学依据。

2 数据与研究方法

2.1 研究区概况

上海市位于中国华东地区(120°52′~122°12′E、30°40′~31°53′N),东濒东海、南临杭州湾,西侧与江苏省和浙江省相接(图1)。上海平均海拔高度约2 m,平均气温17.6 ℃,降水量约1 173 mm。地属亚热带季风气候,四季分明、日照充分、雨量充沛。上海是中国国际金融与贸易的中心,总面积6 340.5 km2,常住人口2 489.43万人(2021年末常住人口)。全市下辖16个区,其中,杨浦区位于上海中心城区东北部,与浦东新区隔江相望,在上海中心城区中拥有最多的棚户区20,分布较为分散,主要位于杨浦区的最南部,靠近黄浦江。本文以杨浦区南部约15 km2的区域作为研究区,该区域南部与东部范围至黄浦江边界,北至控江路,西至杨浦行政区边界,其中包含杨浦棚户区分布处数最多的杨树浦路、平凉路、长阳路以及周家嘴路。

图1

图1   研究区位置概况

Fig.1   Location map of the study area


2.2 数据源及预处理

2.2.1 数据源

谷歌地球(Google Earth, GE)遥感影像主要提供卫星数据与航拍数据,卫星数据包括Landsat、IKONOS、Quick Bird和SPOT系列卫星数据,航拍数据主要由Blue Sky和Sunburn公司提供。GE影像的空间分辨率有20个级别(单位为m),1~6级的空间分辨率较低、影像使用较少,第12、13、14级分别与Landsat TM/ETM+、CBERS-1、SPOT卫星影像的空间分辨率相似,第18级与QuickBird(全色0.6 m, 多光谱2.4 m)、Geo Eye-1(全色0.41 m, 多光谱1.65 m)卫星影像相近、分辨率最高。因此,研究使用最新的第18级GE影像为数据源,影像时间为2019年5月。

2.2.2 处理流程

为提取棚户区,主要采取以下处理流程(图2):首先,对原始GE影像规则化网格处理,并进行特征提取;其次,对提取结果进行数据格式处理,并创建分类数据集;最后,使用分类器对分类数据集进行分类,得到分类结果并通过精度验证。研究将城市区域中提取棚户区定义为二进制分类问题,GE图像中提取的特征设定为输入,输出是二进制变量设定为输出,如果城市的特定区域是棚户区,则假定值为1,否则为0。

图2

图2   棚户区提取流程图

Fig.2   Flow chart of the slum extraction


2.2.3 网格处理

提取棚户区时,城市街区的划分是关键问题。Open Street Map(OSM)数据常用于描绘城市街区,可将街道和道路分层。但发展中国家的城市街道网络会因棚户区地区的高密度和复杂性而不完整,或者因近期被占用的地区尚未在OSM数据集中登记21,给城市街区的划分增加了难度。因此,需要对道路和人行道进行视觉解释和手动数字化。研究使用常规网格来检测影像中的棚户区,利用GIS软件绘制矢量或渔网格式的规则网格可快速实现自动化。在图像特征提取和分类的过程中,测试了两种不同尺寸的渔网的使用情况(100 m×100 m和50 m×50 m)。在正确分类棚户区中,使用50 m×50 m网格获得的结果优于100 m×100 m网格结果。因此,本文在研究区域内创建50 m×50 m的正方形单元网格,以提取图像特征。

2.2.4 特征提取

研究基于GE图像和创建的规则网格,采用ENVI软件中的FETEX插件提取图像信息。图像的纹理特征和结构特征可被用来区分棚户区和非棚户区22-23,FETEX是一个交互式软件包,可用于图像和面向对象的特征提取。研究计算了光谱特征、纹理特征和结构特征3组变量(表1),通过处理位于相同多边形内的像素而不改变图像分辨率或像素值,从图像中提取图像特征。

表1   特征指标

Table 1  Image-derived variables

类型变量指标描述
光谱特征变量MEAN 1波段1的像素平均值
DEVST 1波段1的像素标准差
MAJORITY 1波段1的像素多数值
MEAN 2波段2的像素平均值
DEVST 2波段2的像素标准差
MAJORITY 2波段2的像素多数值
MEAN 3波段3的像素平均值
DEVST 3波段3的像素标准差
MAJORITY 3波段3的像素多数值
纹理特征变量MEAN_EDG边缘因子均值
DEVST_EDG边缘因子标准差
UNIFORGLCM的均匀性
ENTROPGLCM的商
CONTRASGLCM的对比
IDMGLCM的逆差距
COVARGLCM的协方差
VARIANGLCM的方差
CORRELACGLCM的相关性
SKEWNESS直方图的偏度
KURTOSIS直方图的峰度
结构特征变量RVF滞后一期比方差
RSF滞后一期比方差与滞后二期比方差之比
FDO原点附近的一阶导数
SDT滞后三期的二阶导数
MFM到第一个最大值的半变异函数平均值
VFM半方差函数值到第一个最大值的方差
DMF到第一个最大值的半变异函数平均值与滞后一期半方差的差值
RMM第一局部最大值的半方差与到这个最大值的半变异函数平均值的比率
SDF滞后一期与第一最大值之间的二阶分差
AFM滞后一期半变异函数值与到第一个最大值的半变异函数之间的面积

新窗口打开| 下载CSV


光谱特征提供有关颜色的信息,包括每个多边形内部像素值的汇总统计以及有关物体光谱响应的信息,研究选取每个RGB波段的平均值和标准差以及该组中大多数的统计量,因为这些特征易于理解,能够较好的提供有关城市间光谱差异的信息。纹理和结构特征则提供关于图像内元素的空间排列的信息,其中纹理特征表征图像强度值的空间分布,并提供有关对比度、均匀度、粗糙度等信息;结构特征表征空间分布的随机性或规律性,FETEX可以利用半方差函数法量化其结构特征,是确定规则模式的合适工具24

2.2.5 创建数据集

创建数据集首先要进行样本的选择,本文使用OBIA图象分析方法中常用的二元分类法将样本中的每个多边形进行手动标记,分为“棚户区”和“非棚户区”两个类别,并基于参考辅助信息和以往的研究25,对已确定的棚户区进行抽样检查。研究区内的非棚户区包括高低住宅区、公园、城市森林、绿地、商业和工业区等规范的城市布局,具体采样案例如图3所示。将最终提取的数据集分为两组:训练集(60%)和测试集(40%),训练集包括用于训练和调整分类模型的采样多边形,测试集的采样多边形用于评估分类模型的预测能力(表2)。

图3

图3   GE图像规则网格中的城市街道和抽样区域

Fig.3   Urban areas and selected sectors showing the regular grid over the GE images


表2   数据集的组成(网格数量)

Table 2  Composition of the dataset (number of grid)

总计棚户区非棚户区训练集测试集
数据集8 3724647 9084 0003 772

新窗口打开| 下载CSV


2.3 研究方法
2.3.1 机器学习方法

机器学习方法主要可分为监督学习方法和非监督学习方法两类。在缺乏先验知识的情况下,非监督学习方法可能无法将GE图像的特征学习到令人满意的水平;而在训练数据的支持下,监督学习方法通常可以提供更好的分类结果。因此,研究采用机器学习中的监督学习方法进行特征提取与图像分类,并分析比较。

(1)在图像识别中,最近邻算法(K-Nearest Neighbor, KNN)是一种基于特征空间中最近训练实例对象进行分类的方法26。给定一个训练数据集,在训练数据集中找到与新输入实例的最近邻的K个实例(即K个邻近样本),因为这K个实例多数属于某个类,所以就把该输入实例匹配到这个类别中。KNN是图像识别中一种简单的、基本的方法,当数据分布的信息不足时,该方法是首选的分类方法之一27

(2)逻辑回归算法(Logistic Regression, LR),使用输入变量线性加权实现分类,最终输出概率估计,是二分类因变量常用的统计分析方法28。假设有数据集合D=Xi,Yi,i=1,,N,输入变量集合为Xi={x1,x2,x3,,xn}Yi={y1,y2,y3,,yn}表示类别集合,yi{0, 1},LR表示为如下概率模型:

P(Yi=1|Xi)=eβ0+β1x1+β2x2++βixi1+eβ0+β1x1+β2x2++βixi

其中:P是预测的概率;β0是常数;βi是第i个输入变量Xi的系数权重;因此该概率模型可简化为:

PYi=1|Xi=eωΦi(x)1+eωΦi(x)

其中:Xi是第i个输入变量集合;ω是输入变量权重集合,表示不同的变量所占的不同比重;Φi(x)是输入变量转换为的变量函数。

模型中的权重参数ω,使用最大似然估计(Maximum Likelihood Estimation, MLE)来求解,定义MLE函数公式如下:

Lω=i=1nf(xi|ω)
fx1,x2,x3,,xn|ω=1e-ωΦi(x)

其中: ω=(ω1, ω2, ω3, , ωn)T是系数向量;Φi(x)是输入变量转换为的变量函数。

(3)支持向量机算法(Support Vector Machine, SVM),是在由核函数确定的特征空间上构造软间隔分离超平面,使分类间隔最大的分类面为最优分类面29-30。对于任意样本x, y,SVM中常用的核函数有:

a. 线性核函数

Kx,y=x*y

b. 多项式核函数

Kx,y=x*y+1q(q=1,2,··)

c. 高斯核函数

Kx,y=exp (-r2x-y2)

d. Sigmoid核函数

Kxi,yi=tanh [vxi,yi+c]

核函数的类型与参数的选取直接影响SVM的分类精度,因此在实验部分,采用常用的多项式核函数(SVMk)和高斯核函数(SVMrbk)。

(4)随机森林算法(Random Forest, RF),通过结合大量的决策树来改进分类与回归树(Classification and Regression Tree, CART),是一种集成学习技术。RF算法是基于对决策树的组合,即在变量和数据的使用上进行随机化,生成很多决策树分类模型{h(Xk), k=1, },每棵树之间没有关联, 参数集为独立同分布的随机向量, 在自变量 X 给定时, 每个决策树分类模型都采用投票的方法产生最优的结果。当原始数据进入RF后, 每棵决策树都对其进行分类, 最后取所有树中出现频率最高的分类结果作为最终结果。

(5)集成学习算法(Ensemble Learning, EL),通过训练得到不同的基分类器,根据规则组合这些分类器来解决同一个问题,是一种可以显著提高学习系统泛化能力的机器学习方法。EL算法主要包含3个步骤:首先,通过处理原始数据集来产生差异性的数据子集,在具有差异性的数据子集上训练,得到具有差异性的基分类器;其次,将生成的一系列基分类器按照某种度量标准或策略选择出最优的基分类器,参与集成分类;最终,进行基分类器的集成(即组合)。

2.3.2 定量评价方法

为了定量评价各算法的性能,采用精准率、召回率、总体精度、Kappa系数、运行时间5个定量评价指标,对各算法提取棚户区的精度进行评价,其中各指标定义如下:

(1)混淆矩阵:TP表示被正确分类为非棚户区的实际非棚户区,FP表示棚户区被错误分类为非棚户区,FN表示非棚户区被错误分类为棚户区,TN表示被正确分类为棚户区的实际棚户区,该参数全面描述了二进制分类结果的性能(表3)。

表3   混淆矩阵

Table 3  Confusion Matrix

True Positives (TP)False Positives (FP)
False Negatives (FN)True Negatives (TN)

新窗口打开| 下载CSV


(2)精准率(Precision):“预测为正例”的那些数据里“预测正确”的数据个数。

Precision=TNTN+FP

(3)召回率(Recall):表示的是样本中的正例有多少被“预测正确”了。

Recall=TNTN+FN

(4)总体精度(Overall Accuracy, OA):用于衡量分类器的整体性能。

OverallAccuracy=TP+TNTP+FP+FN+TN

(5)Kappa系数:通过测量定性项目之间的评分一致性来全面描述分类的准确性。

Kappa=2×TP×TN-FP×FNTP2TN+FP+FN+TNFP+FN+FP2+FN2

3 棚户区识别结果

3.1 实验环境与参数设置

实验使用的计算机配置为Intel Core(TM) i7-4790 3.6GHz CPU、8GB RAM,操作系统为Windows 10,程序开发环境为Python 3.6。研究使用机器学习算法中的超参数如下:

KNN:n_neighbors为选取的相邻样本数量,本文选取8;weight为距离的权重,uniform为不考虑距离的权重,distance以距离的倒数作为权重;p为明可夫斯基距离,p=1是曼哈顿距离、p=2是欧式距离。

LR:penalty是正则化方式,用来防止模型过拟合,L1和L2正则化是常用的两种选项;C是正则化强度的倒数,用来控制正则化程度;degree是多项式系数,值越大、多项式的最高项次数越大。

SVM:d是SVMk中的多项式系数,值越大、多项式最高项次数越大,研究选取3;gamma是SVMrbk中的系数,决定了数据映射到新的特征空间后的分布,值越大、支持向量越少,值越小、支持向量越多,支持向量的个数影响训练与预测的速度,研究取值为0.5。

RF:n_estimators为决策树的数量,虽然决策树的数量越多、性能越好,预测也越稳定,但会减慢计算速度;max_features为每次节点分割时考虑的特征数量,表示随机森林在单个树中可拥有的特征最大数量;min_sample_leaf为叶子节点的最少样本数。

EL:voting为投票方式,其中hard表示最终决策方式为Hard Voting Classifier,即根据少数服从多数来判定最终结果;soft的最终决策方式为Soft Voting Classifier,将所有模型预测样本为某一类别的概率的平均值作为标准,概率最高对应的类型为最终预测结果。

以上超参数使用scikit-learn库中的GridSearchCV方法进行网格搜索,详细设置见表4

表4   算法超参数设置

Table 4  Experimental hyperparameters

方法超参数
KNNn_neighbors: 8、weight: uniform
LRpenalty: L2、C、degree
SVMd: 3、gamma: 0.5
RFn_estimators: 500、max_features: 16、min_sample_leaf: 5
ELvoting: soft

新窗口打开| 下载CSV


3.2 识别结果与定量分析

3.2.1 棚户区识别结果

研究选取2019年5月的GE影像(空间分辨率为1.2 m)对各类算法的有效性和提取精度进行分析验证。其中,图4(a)为测试集原始遥感影像,影像数据中包含了多种分布类型的建筑物(密集型、稀疏型、规则型等),同时影像中还包含裸地、水体、公路、施工用地等多种地物类型,地物环境较为复杂。图4(b)为手动标记提取的参考结果,图4(c)~图4(h)是本文各类算法提取的棚户区结果。图5为各算法提取棚户区的局部效果对比,主要对提取棚户区效果较好和效果稍差的部分进行了局部放大,它们分别对应图4(a)中的黄色矩形区域(编号R1~R4)。

图4

图4   各算法测试结果比较

Fig.4   Experimental results comparison for each algorithm


图5

图5   各算法提取棚户区局部效果对比图(R1-R4为图4标记区域)

Fig.5   Comparison of extraction partial details for each algorithm (R1-R4 for marked area in Fig.4)


图4可以看出,各算法提取棚户区的整体效果较好,与参考结果(测试集)十分接近。根据图5中各区域的局部放大结果,R1、R2、R3是各算法提取效果较好的区域,同时也是本文棚户区主要的分布区域,所提取的棚户区与参考数据比较相符。R4为提取效果稍差的区域,除SVMrbk算法外,其它算法提取结果中均存在部分误提错误。造成R4区域部分建筑物误提的主要原因是该区域为排列紧密的上海国际时尚中心场馆,它与棚户区的形状纹理和结构特征相似,因此容易被当成棚户区提取出来。除R4区域外,部分零散区域也容易出现类似漏提、误提错误。比如,图4(a)中一些靠岸的零散红色区域,为河流船舶集中停泊的区域,因船舶分布与棚户区屋顶不规则、高密度特征相似,也容易出现误提现象。还有一些区域出现漏提现象的主要原因是由于这些棚户区处于高层建筑的阴影处,图像光谱特征、纹理特征不足,因此在该处检测到的建筑物特征点较少,从而在提取棚户区时容易将其识别为非棚户区。

从各算法提取棚户区的结果来看,均具有较好的提取能力,但还存在以下不足:①易将仓库、停车场、船舶停泊等高密度区域误判为棚户区;②在高层建筑的阴影区域容易出现漏提现象。

3.2.2 结果定量分析

采用精准率(Precision)、召回率(Recall)、总体精度(Overall Accuracy, OA)、Kappa系数和运行时间5个指标,对提取棚户区的精度进行评价,得到如下结果:

根据上述实验结果(图4~图5)与各算法的精度评价结果(表5):①EL算法的Kappa系数和总体精度均高于其它算法,其中EL算法的Kappa系数比KNN、LR、SVMkSVMrbk、RF算法分别高出5.1%、1.8%、12.1%、2.4%、6.3%,总体精度比KNN、LR、SVMkSVMrbk、RF分别高出0.6%、0.24%、0.71%、0.13%、0.38。②EL算法在各算法中具有最高的召回率,较KNN、LR、SVMkSVMrbk、RF算法分别高出2.78%,0.01%,21.56%,13.27%,13.97%。③在精准率方面,SVMrbk算法的精准率最高,为79.33%。从整体实验结果(图4)和R1、R2、R3、R4 共4个细节对比图(图5)可知,EL算法的漏分错误最少,SVMrbk算法的漏分错误最多,但在R4区域中SVMrbk算法是唯一分类成功的,使其精确度大幅提高,因此其实际精准率应更低一些。④在运行效率方面,KNN、LR、SVMkSVMrbk明显优于RF和EL算法,EL算法表现最差(3.608 4 s)。

表5   各算法的精度评价结果比较

Table 5  Comparison of accuracy assessment for each algorithm

方法OA/%

Precision

/%

Recall

/%

Kappa

/%

运行时间

/s

KNN96.6764.1976.2467.90.063 4
LR97.0367.4579.0171.20.072 3
SVMk96.5668.8757.4660.90.071 0
SVMrbk97.1479.3365.7570.60.092 8
RF96.8972.2665.0566.70.159 8
EL97.2770.4479.0273.03.608 4

新窗口打开| 下载CSV


根据上述分析,EL算法的Kappa系数、总体精度和召回率方面均高于其它算法,但在运行效率方面明显不占优势。虽然EL算法相较其它算法能够更加完整、准确地完成棚户区的信息提取,但提取更大范围棚户区时,SVMk算法更加高效(表5)。

4 结 语

本文选取上海杨浦区南部典型的棚户区,利用高分辨率遥感影像和机器学习算法,综合考量精准率、召回率、总体精度、Kappa系数和运行时间5个定量评价指标,对KNN、LR、SVMkSVMrbk、RF算法进行分析比较,以期获得适用于上海棚户区的提取方法。结果表明:

(1)各算法Kappa系数均高于60%,总体精度均高于96.5%,说明典型的机器学习方法提取棚户区的精度基本能够满足棚户区的研究及实际应用。

(2)EL算法的Kappa系数、总体精度和召回率方面均高于其它算法,且漏分错误最少,虽然运行效率较差,但仍在可接受范围,因此EL算法更适合综合要求较高的场景。

(3)排除SVMrbk的精确率误差后,LR算法的Kappa系数、总体精度和召回率方面仅次于EL算法,但其运行效率远高于EL算法,LR算法更适用于大范围棚户区的使用需求。

本文通过训练相应识别样本,完成了对棚户区的遥感识别,它还可以应用于高分辨率遥感图像中的其它特征识别,如道路和农田。因此,实验结果不仅证明了监督机器学习在遥感监测方面的应用能力,同时也预示了该方法在城市规划和测绘等方面的应用潜力。但本文还有许多待完善的问题:为了测试方法的稳定性,需要测试更多的扩展区域和复杂情况;为了减轻创建的劳动密集型任务,可以探索将一个区域的学习模型应用于其它具有相似景观的区域;使用EL算法时仅采用投票法,将所涉及的其他分类器作为弱分类器进行多分类器融合,对于弱分类器的组合策略并未深入探索。

参考文献

LI Naisheng.

Thoughts on prevention and control of urban shanty towns

[J]. Urban Development Studies, 200071):32-34.

[本文引用: 1]

李乃胜.

城市棚户区防治的思考

[J]. 城市发展研究, 200071):32-34.

[本文引用: 1]

WANG MingfengCHENG HongNING Yuemin.

Social integration of migrants in Shanghai's urban villages

[J]. Acta Geographica Sinica, 2015708):1243-1254.

[本文引用: 1]

汪明峰程红宁越敏.

上海城中村外来人口的社会融合及其影响因素

[J]. 地理学报, 2015708): 1243-1254.

[本文引用: 1]

Nations United. International development strategy for the third United Nations development decade[M]. New YorkUnited Nations1980.

[本文引用: 1]

Nations United. Transforming our world: the 2030 Agenda for Sustainable Development[M]. New YorkUnited Nations2015.

[本文引用: 1]

GAO XiuxiuZHANG XiaotongHE Zheng.

Emergence of the urban goal and its practice: Background and progress of the SDG11

[J]. China Population,Resources and Environment, 20213111):144-154.

[本文引用: 1]

高秀秀张晓彤何正.

城镇和人类住区议题的演进与实践: SDG11的形成背景及执行进展

[J], 中国人口·资源与环境, 20213111):144-154.

[本文引用: 1]

HUANG XLIU HZHANG L.

Spatiotemporal detection and analysis of urban villages in mega city regions of China using high-resolution remotely sensed imagery

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2015537):3639-3657. DOI: 10.1109/TGRS.2014.2380779

[本文引用: 1]

KUFFER MPFEFFER KSLIUZAS R.

Slums from space—15 years of slum mapping using remote sensing

[J]. Remote Sensing, 201686):455. DOI: 10.3390/rs8060455

[本文引用: 2]

HOFMAN PSTROBL JBLASCHLE Tet al.

Detecting informal settlements from QuickBird data in Rio de Janeiro using an object based approach

[J]. Springer Berlin Heidelberg, 2008.DOI: 10.1007/978-3-540-77058-9_29

[本文引用: 1]

SEBASTIAN D OBODO CBIRGIT K.

An object-based classification approach for mapping migrant housing in the mega-urban area of the Pearl River Delta (China)

[J].Remote Sensing, 201138):1710-1723. DOI: 10.3390/rs3081710

[本文引用: 1]

JIANG DongCHEN ShuaiDING Fangyuet al.

Classification of remote sensing image based on object-oriented method: A case study of Baixiang County

[J]. Remote Sensing Technology and Application, 2018331):143-150.

[本文引用: 1]

江东陈帅丁方宇.

基于面向对象的遥感影像分类研究——以河北省柏乡县为例

[J]. 遥感技术与应用, 2018331):143-150.

[本文引用: 1]

ZHANG LiangpeiSHEN Huanfeng.

Progress and future of remote sensing data fusion

[J]. Journal of Remote Sensing,2016205):1050-1061.

[本文引用: 1]

张良培沈焕锋.

遥感数据融合的进展与前瞻

[J]. 遥感学报, 2016205):1050-1061.

[本文引用: 1]

ZHAO YunhanCHEN GangqiangCHEN Guanglianget al.

Integrating multi-source big data to extract buildings of urban villages: A case study of Tianhe district, Guangzhou

[J]. Geography and Geo-Information Science,2018345):7-13.

[本文引用: 1]

赵云涵陈刚强陈广亮.

耦合多源大数据提取城中村建筑物——以广州市天河区为例

[J]. 地理与地理信息科学,2018345):7-13.

[本文引用: 1]

CUI ChengZHAO LuREN Hongyanet al.

Integrating high-resolution remote sensing image and street view image to identify urban village: A case study in Yuexiu district, Guangzhou city

[J].Journal of Remote Sensing,2020269):1802-1813.

[本文引用: 1]

崔成赵璐任红艳.

耦合高分遥感影像与街景影像的广州市越秀区城中村识别

[J]. 遥感学报,2020269):1802-1813.

[本文引用: 1]

FENG QuanlongCHEN BoanNIU Bowenet al.

Identification of urban villages from remote sensing image based on multi-scale dilated convolutional neural network

[J]. Transactions of the Chinese Society of Agricultural Machinery, 20215211):181-218.

[本文引用: 1]

冯权泷陈泊安牛博文.

基于多尺度扩张卷积神经网络的城中村遥感识别

[J]. 农业机械学报, 20215211):181-218.

[本文引用: 1]

WURM MWEIGAND MSCHMITT Aet al.

Exploitation of textural and morphological image features in Sentinel-2A data for slum mapping

[C]∥2017 Joint Urban Remote Sensing Event(JURSE)2017.Dubai,UAEIEEE,2017:1-4.

LEONITA GKUFFER MSLIUZAS Ret al.

Machine learning-based slum mapping in support of slum upgrading programs: The case of Bandung City,Indonesia

[J].Remote sensing,20181010):1522.DOI:10.3390/rs10101522

DUQUE J CPATINO J EBETANCOURT A.

Exploring the potential of machine learning for automatic slum identification from VHR imagery

[J]. Remote Sensing,201799):895. DOI: 10.3390/rs9090895

[本文引用: 1]

WEAVER JMOORE BREITH Aet al.

A comparison of machine learning techniques to extract human settlements from high resolution imagery

[C]//IGARSS 2018-2018 IEEE International Geoscience and Remote Sensing Symposium2018. Valencia, SpainIEEE, 2018: 6412-6415.

[本文引用: 1]

LIAN XihongQI YuanWANG Hongweiet al.

Automatic extraction of residential information based on object-oriented in the Areas around the Qinghai Lake

[J]. Remote Sensing Technology and Application, 2020354):775-785.

[本文引用: 1]

连喜红祁元王宏伟.

基于面向对象的青海湖环湖区居民地信息自动化提取

[J]. 遥感技术与应用, 2020354):775-785.

[本文引用: 1]

MENG Meijun.

Research on Shanghai shanty area space change (1927-present)

[D]. ShanghaiEast China Normal University, China2006.孟眉军. 上海市棚户区空间变迁研究(1927年—至今)[D]. 上海:华东师范大学, 2006.

[本文引用: 1]

TAUBENBÖCK HKRAFF N J.

The physical face of slums: A structural comparison of slums in Mumbai, India, based on remotely sensed data

[J]. Journal of Housing and the Built Environment, 2013291):15-38.

[本文引用: 1]

KIT OLÜDEKE M.

Automated detection of slum area change in Hyderabad, India using multitemporal satellite imagery

[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 201383130-137.

[本文引用: 1]

DUQUE J CPATINO J ERUIZ L Aet al.

Measuring intra-urban poverty using land cover and texture metrics derived from remote sensing data

[J].Landscape and Urban Planning, 201513511-21. DOI: 10.1016/j.landurbplan.2014.11.009

[本文引用: 1]

RUIZ L ARECIO J AFERNÁNDEZ-SARRÍA Aet al.

A feature extraction software tool for agricultural object-based image analysis

[J]. Computers and Electronics in Agriculture, 2011762):284-296. DOI:10.1016/j.compag.2011.02.007

[本文引用: 1]

RHINANE HHILALI ABERRADA Aet al.

Detecting slums from SPOT data in Casablanca Morocco using an object based approach

[J]. Journal of Geographic Information System, 201133):217-224. DOI: 10.4236/jgis.2011.33018

[本文引用: 1]

YANG LihuaDAI QiGUO Yanjun.

Study on KNN text categorization algorithm

[J]. Control and Automation, 20062221):269-270 185.

[本文引用: 1]

杨丽华戴齐郭艳军.

KNN文本分类算法研究

[J]. 微计算机信息, 20062221):269-270 185.

[本文引用: 1]

DEVIJVER P AKITTLER J.

Pattern recognition: A statistical approach

[J]. Prentice-Hall International, 1982.

[本文引用: 1]

WANG ZhenfeiLIU KailiZHENG Zhiyunet al.

Prediction retweeting of microblog based on logistic regression model

[J]. Journal of Chinese Computer Systems,2016378):1651-1655.

[本文引用: 1]

王振飞刘凯莉郑志蕴.

基于逻辑回归模型的微博转发预测

[J]. 小型微型计算机系统,2016378):1651-1655.

[本文引用: 1]

LI Hang. Statistical learning methods[M]. BeijingTsinghua University Press2012.

[本文引用: 1]

李航. 统计学习方法[M]. 北京清华大学出版社2012.

[本文引用: 1]

ZHOU Z H. Machine learning[M]. BeijingTsinghua University Press2016.

[本文引用: 1]

周志华. 机器学习[M]. 北京清华大学出版社2016.

[本文引用: 1]

/