土地覆盖、土地利用是自然和人类力量共同塑造的结果,也是人类活动对地表自然生态系统影响的直接表现形式(
21世纪以来,随着社会经济持续快速发展以及工业化、城市化进程的加快,中国耕地经受巨大压力,影响到中国粮食安全;同时一系列环境破坏问题,也对中国自然生态系统的可持续性构成威胁(
国家统计局的统计数据,通常来自地方的调查数据,无法体现细致的空间差异性,且来自不同区域的数据受主观性影响,准确性难以评估。遥感卫星影像由于具备长时间监测能力、较高空间分辨率等特点,已成为土地覆盖、土地利用变化监测的重要数据源之一。为了满足各种应用需求,人们基于遥感数据开展了土地覆盖、土地利用制图的大量努力。然而任何一种产品都无法满足上述应用对空间分辨率、时间频率、土地覆盖/土地利用类型和分类精度的要求。现有粗分辨率制图产品包括全球5 km地表覆盖制图产品GLASS-GLC(
总体来看,已有的土地覆盖产品最高的时间频率通常到年,更高的时间频率,如季节尺度土地覆盖数据,很少(
样本问题是当前土地覆盖制图,尤其是大范围、高精度、高频率时序制图的阻碍之一(
遥感大数据是土地时序制图面临的另一大瓶颈(
Landsat是当前时间序列分析和制图中使用最广泛的卫星数据源(Woodcoc等,2008;
此外,已有的土地制图数据,常常针对土地覆盖或土地利用,无法满足其他应用需求。分类系统简单且灵活性差,无法根据不同应用需求,提供不同类别粒度的层次化产品(
考虑到已有数据和产品存在的缺陷和中国土地评估的重要性,为了把握和揭示中国土地覆盖、土地利用变化的时空特征,我们基于AWS云计算环境,生产了中国21世纪以来逐年多季节、多分类系统的30 m空间分辨率的土地覆盖、土地利用数据产品。为了提高Landsat数据一致性、时间频率和数据质量,提出基于虚拟星座的时空融合和重建技术,首次建成了21世纪中国逐日30 m的无缝数据立方体SDC(Seamless Data Cube)。我们开发了基于变化检测和时空一致性的长时序高分辨率动态制图框架。为了满足不同的应用需求,该产品中逐年数据的分类系统有3种类型、两级结构,土地覆盖分类系统有FROM-GLC分类系统、FAO Land Cover Classification System(LCCS),土地利用分类系统来自CNLUCC分类系统。针对FROM-GLC土地覆盖分类系统,生产了逐季节产品。
如前所述,气候变化研究、地球系统模式发展、及农林管理、碳氮循环和水循环模拟和生物多样性保护及防灾减灾等迫切需要遥感制图创新。这既是世界性的需求也是科学发展的必然趋势。信息技术发展到今天,使人类知识数字化,使人类智慧逐步在虚拟空间得以积累和应用,给既模仿学习人工遥感制图的灵活性、又利用计算机处理超高维多样化的海量数据的准确性和高效性创造了条件。人工智能技术中计算机的人脸识别精度超过人类代表着机器智慧达到了新高度。在遥感制图领域,我们把既能像专业制图人员一样综合利用色彩、纹理、相对位置、图像要素上下文、和其他辅助地理知识,又能充分发挥计算机在制图人员难以做到的快速、大规模处理超过三维空间的海量数据方面的优势的计算技术称为智慧遥感制图iMap(intelligent mapping of land cover and land use )。作为实现智慧遥感制图的初步尝试,本文提出一套新的智慧遥感制图框架(
新智慧遥感制图框架旨在以高性能云计算平台为支撑,在综合利用国内外多源遥感数据、定量遥感产品和社交媒体等非传统遥感数据的框架下,构建虚拟星座,结合大数据驱动的机器学习等人工智能方法,探索和解决无缝智能数据重建、面向用户需求的层次化分类系统设计、普适样本库构建及迁移、时空一致性变化检测等基础性遥感难题,生产一系列高精度、具有国际先进水平的多尺度长时序全球地表覆盖制图产品,并提供基于云计算的在线制图平台,为遥感、地球系统科学以及社会经济发展提供关键性基础支撑,实现多尺度、多要素、精准化的智慧遥感制图服务。
在智慧遥感制图理念指导下,本文以21世纪中国为研究对象,提出了基于虚拟星座的无缝数据立方体融合重建的技术方案,和长时序高分辨率一致性动态制图框架(
本文基于亚马逊云计算AWS(Amazon web Services)平台,搭建了在线实时、自动化、无服务器、端到端的遥感大数据生产链和并行制图系统,以完成全部生产处理流程。AWS公开数据集(AWS Open Data)提供了所需的Landsat、MODIS等遥感数据源。AWS高性能、高弹性、可扩展的分布式算力,满足了快速处理PB级数据的计算资源需求。借助AWS Step Functions,将AWS Lambda、Amazon ECS(Amazon Elastic Container Service ) 等云服务组合,搭建了自动化、无服务器、端到端的流式生产链。AWS提供了完善的人工智能和机器学习服务,采用Amazon SageMaker工具,高效设计和训练了影像修复模型和制图分类模型,并借助AutoML对模型结构和参数进行深度调优,最终完成分布式高性能推理。
本文使用了来自亚马逊公开数据集(AWS open data)和谷歌云存储(Google cloud storage)的2000年—2019年所有可用的Landsat L1T (Level 1 terrain-corrected)影像。中国范围内一共包括579个图幅(Path/Row)。采用与Landsat分析就绪数据ARD(Analysis Ready Data)相同的范式对所有Landsat数据进行大气校正、生成表面反射率(
为提高数据的时间频率和空间完整性,本文采用了来自AWS open data和美国地质调查局(USGS)同期的500 m 逐日MODIS MCD43A4 第六代NBAR数据产品与Landsat组成虚拟星座。用质量信息波段对MODIS进行预处理。所用波段如
Landsat与MODIS对应波段
波段 | Landsat NBAR | MODIS NBAR | |||
---|---|---|---|---|---|
Landsat 5 TM | Landsat 7 ETM+ | Landsat 8 OLI | MCD43A4 | ||
Blue | 0.450—0.520 | 0.450—0.520 | 0.450—0.510 | 0.459—0.479 | |
Green | 0.520—0.600 | 0.520—0.600 | 0.530—0.590 | 0.545—0.565 | |
Red | 0.630—0.690 | 0.630—0.690 | 0.640—0.670 | 0.620—0.670 | |
NIR | 0.760—0.900 | 0.770—0.900 | 0.850—0.880 | 0.841—0.876 | |
SWIR 1 | 1.550—1.750 | 1.550—1.750 | 1.570—1.650 | 1.628—1.652 | |
SWIR 2 | 2.080—2.350 | 2.090—2.350 | 2.110—2.290 | 2.105—2.155 |
MODIS数据观测频率高,互补信息相对多,采用经典的算法流程对MODIS影像进行修复。首先,本文利用邻近相似像元插补算法NSPI(Neighborhood Similar Pixel Interpolator)方法(Chenaf等, 2011)对MODIS缺失进行填补。NSPI方法原理简单,同时又较高的计算效率(Zhuaf等,2012)。NSPI方法基于同类地物光谱信息的空间连续性特征,以及这种特征在时间尺度上的不变性的合理假设,以邻近时间影像作为参考,使用加权线性模型预测目标像素(
式中,
进一步采用加权惠特克平滑算法(weighted Whittaker smoothing)(
式中,
Landsat数据纹理信息相对丰富,但观测频率低,影像修复相对MODIS要求高。为此,提出时空多源引导对抗修复网络(
式中,
值得指出的是,所提出的时空多源引导对抗修复网络,可以结合多源的遥感数据进行互补修复引导,包括MODIS、SAR等。通过结合时空信息、对抗学习、残差学习等范式,能够高精度逼真修复影像任何条带、云或阴影导致的缺失。
基于改进的时空自适应反射率融合算法ESTARFM(Enhanced Spatial and Temporal Adaptive Reflectance Fusion Model)(
式中,
式中,
对于融合结果进一步经过weighted Whittaker smoothing处理,得到长时序高一致性的高空间分辨率、高时间频率(30 m、逐日)的无缝数据立方体SDC(Seamless Data Cube)。
基于SDC,本文进一步构建了特征立方体(feature cube),计算了归一化植被指数NDVI(Normalized Difference Vegetation Index)(
采用的分类系统涵盖土地覆盖、土地利用,共3种类型。土地覆盖分类系统来自 FROM-GLC分类系统(
土地覆盖样本来自首套全球30 m分辨率多季节样本集(
土地利用样本从CNLUCC产品(
对于土地覆盖分类系统,将2015年分类器,用于所有年份分类。而土地利用分类系统,对每年,采用最邻近的1期分类器(2000年、2005年、2010年、2015年共4期)。尽管样本的迁移使用会引入一定错误,但有限样本稳定分类理论(
Landsat数据空间分辨率是30 m,对空间上下文信息的依赖相对不高,此处没有采用基于卷积网络的语义分割类算法进行分类。考虑到重建的SDC像素层面的质量较高且信息丰富,我们采用基于像素的分类算法,从而使得结果能够保持更多丰富的纹理细节。基于自动机器学习AutoML(Automated machine learning)的思想,采用AutoGluon工具(
基于提出的SDC重建技术,我们生产了首套21世纪以来中国逐日30 m分辨率SDC。结果展示如
为了检验重建模型的精度和SDC的质量,本文从中国随机选择了500个tile进行检验。参考(
基于提出的长时序高分辨率地表覆盖制图框架,生产了首套21世纪以来中国30 m分辨率逐年土地利用和逐季节土地覆盖图集。2019年FROM-GLC、LCCS和CNLUCC等3种分类体系下制图结果依次显示在
局部区域结果显示了我们的制图结果可有效而细致反映年际土地变化动态。
利用制图结果,统计中国21世纪以来土地变化情况如
总体而言,本文的制图产品在全国范围内的各类曲线与其他不同来源制图产品和统计数据较为一致(
使用验证样本集对制图结果进行精度评价。包括2015年土地覆盖验证数据,4期土地利用验证样本。以及随机选择并解译的500个逐年土地覆盖、土地利用验证样本。评价指标包括整体精度OA(Overall Accuracy),卡帕系数(Kappa coefficient),各类用户精度UA(user’s accuracy)和生产者精度PA(producer’s accuracy)等。本文使用土地覆盖验证样本集对土地覆盖制图结果进行评估。
2015年FROM-GLC一级分类体系验证结果
类别 | 10 | 20 | 30 | 40 | 50 | 60 | 70 | 80 | 90 | 100 | UA/% |
---|---|---|---|---|---|---|---|---|---|---|---|
10 | 308 | 26 | 16 | 8 | 0 | 0 | 0 | 5 | 1 | 0 | 84.6 |
20 | 34 | 450 | 9 | 19 | 0 | 0 | 0 | 1 | 0 | 0 | 87.7 |
30 | 23 | 25 | 281 | 23 | 1 | 1 | 0 | 3 | 56 | 0 | 68.0 |
40 | 6 | 47 | 22 | 28 | 0 | 0 | 0 | 0 | 5 | 0 | 25.9 |
50 | 1 | 2 | 1 | 0 | 3 | 8 | 0 | 1 | 1 | 0 | 17.7 |
60 | 0 | 1 | 0 | 0 | 1 | 11 | 0 | 0 | 0 | 0 | 84.6 |
70 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0.0 |
80 | 16 | 1 | 2 | 1 | 0 | 0 | 0 | 36 | 1 | 0 | 63.2 |
90 | 4 | 1 | 23 | 0 | 1 | 2 | 0 | 2 | 614 | 5 | 94.2 |
100 | 0 | 0 | 2 | 0 | 0 | 1 | 0 | 0 | 5 | 15 | 65.2 |
PA/% | 78.6 | 81.4 | 78.7 | 35.4 | 50.0 | 47.8 | 0.0 | 75.0 | 89.8 | 75.0 | 80.8 |
2015年LCCS一级类、二级类分类结果OA为79.0%、70.4%,kappa为0.72、0.64。耕地的PA、UA分别为77.3%、80.5%。林地、非植被的UA分别达到89.5%、94.3%。非植被的二级类人工表面及相关区域、水体两类PA、UA分别达到86.00%和84.6%、71.67%和95.5%。其中灌木/草本的UA相对较低,为65.2%,这再次说明灌木和草地分类难度大,分类效果不理想。
对CNLUCC土地利用分类系统数据评估结果显示,一级类2000年、2005年、2010年、2015年的OA分别为76.8%、77.0%、76.8%、76.0%。其中城乡、工矿、居民用地一类的UA偏低,这与CNLUCC人工解译方式和对该类定义倾向于居民区有一定关系。几类与湿地相关的类别的UA相对较低,与湿地类别分类难度大有关。湿地地区光谱时空变异性强,地表状态变化大,易与水体、草地、灌木等多类混分。
为了更好地掌握逐年制图精度,本文利用逐年样本对制图结果进行了检验。
2015年FROM-GLC一级类分类体系下季节土地覆盖分类结果,春夏秋冬的OA分别为68.7%、70.5%、65.9%、66.9%。夏季分类精度最高,这可能与夏季为生长季,植物状态更好分辨有关。总体来看,季节制图结果精度低于年际制图结果,这与年际制图每年可用观测量多于一个季节的观测量有关。观测量少,云、大气状况、噪声等因素相对影响大,将严重干扰分类结果。
本文提出了智慧遥感制图的概念和一套智慧遥感制图的框架,该框架从用户需求出发、问题驱动,能够极大地改善当前数据产品难以满足农林管理、国情监测、生态环境保护、防灾减灾、城市建设等用户多样化、高精度地表监测需求的现状。
在该框架的指导下,本文基于AWS高性能、高弹性、可扩展的分布式计算资源,搭建了在线实时、自动化、无服务器、端到端的遥感大数据生产链和并行制图系统,并生产了首套21世纪中国全境逐日SDC及逐年逐季节土地覆盖和土地利用制图产品。逐日SDC,填补了高时空分辨率遥感观测的空白,作为ARD,对于高精度定量遥感反演和制图具有较大价值。逐年逐季节地表制图产品,平均精度超过80%,具有高时空一致性。这两套产品能够以前所未有的高空间分辨率和时间频率反映地表格局与动态变化,为科学研究、国民经济、社会发展提供了重要的基础地理数据,同时证明了智慧制图框架的可行性和有效性。未来,我们将进一步完善和发展智慧遥感制图理论和框架,以开放和灵活的理念,为促进中国遥感数据的易用和好用提供新思路。