随着深度学习的快速发展,基于图像的配准、语义分割、实例分割等性能得以大幅提升。利用海量训练集(如 ImageNet、LFW等),卷积神经网络已经获得接近甚至超越人类的识别准确度。点云是现实世界三维数字化的最直接表达。尽管点云智能处理方面已取得了大量的进展(
地面激光扫描TLS(Terrestrial Laser Scanner)系统对地物表面的三维几何信息进行高速度、高密度、高精度地采集,获取三维点云,具有机动灵活、便于携带等优点,被广泛应用于城市发展跟踪、森林结构评估、滑坡监测、文化遗产保护、工业设施测量、犯罪现场调查等领域(
TLS点云配准需要解决密度变化、扫描视角差异、重叠度限制、重复和对称结构等带来的配准稳健性等问题(
WHU-TLS基准数据集的特点主要体现在: (1)基准数据集由测距范围、测量精度、观测视场等各异的主流激光扫描系统 (如VZ-400、IMAGER5010C、ScanStationC5、LeicaP40、Leica HDS6100)采集;(2)基准数据集场景丰富,涵盖地表覆盖、地物类型、几何形态各异的10种场景类型;(3) 基准数据集提供了包含极低重叠度的相邻点云(如隧道数据集的最小重叠度为5.5%);(4)基准数据集提供了包含重复对称结构的典型场景(如隧道数据集的墙瓦和高速铁路数据集的轨道),以及弱几何特征的典型场景(如隧道的顶部);(5) 基准数据集提供了包含运动对象(如校园、古建筑数据集),以及场景变化的数据集 (如山地数据集)。
WHU-TLS基准数据集概述
名称 | 扫描仪 | 测站数 | 点数/ million | 重叠度 /% | |
---|---|---|---|---|---|
最小 | 最大 | ||||
WHU-TLS Subway | IMAGER 5010C | 6 | 237.57 | 23.7 | 64.3 |
WHU-TLS Railway | VZ-400 | 8 | 49.86 | 10.9 | 66.1 |
WHU-TLS Mountain | ScanStation C5 | 6 | 19.61 | 13.4 | 42.3 |
WHU-TLS Forest | Leica HDS6100 | 5 | 149.45 | 34.6 | 55.5 |
WHU-TLS Park | VZ-400 | 32 | 160.24 | 24.4 | 82.8 |
WHU-TLS Campus | VZ-400 | 10 | 109.05 | 5.6 | 49.6 |
WHU-TLS Residence | Leica P40 | 7 | 43.70 | 1.0 | 91.4 |
WHU-TLS River bank | VZ-400 | 13 | 93.11 | 22.6 | 49.6 |
WHU-TLS Heritage building | VZ-400 | 9 | 238.16 | 28.7 | 69.4 |
WHU-TLS Excavation | VZ-400 | 12 | 482.42 | 9.0 | 72.8 |
WHU-TLS Tunnel | VZ-400 | 7 | 157.02 | 5.50 | 32.0 |
WHU-TLS地铁站数据集采用Z+F IMAGER?5010C地面站激光扫描系统获取。该激光扫描系统集成了CCD相机和激光扫描仪,将丰富的色彩信息与高分辨率的扫描数据相结合。该数据集包含6个测站,共计约2.4亿个点,相邻点云之间最小重叠23.7%,最大重叠64.3%。地铁站场景主要由结构化元素(如电梯、柱子、墙壁)和移动的行人组成,为克服对称结构和移动对象影响的配准算法提供了典型测试数据。此外,地铁站场景还包含了大量由镜像反射引起的虚拟点,进一步增加了点云配准的难度。
WHU-TLS高速铁路数据集采用RIEGL VZ-400地面站激光扫描系统获取,包含8个测站,共计约0.5亿个点。WHU-TLS高速铁路场景主要由结构化的元素(如,铁轨、电线杆、平台)和非结构元素(如树木、岩石)组成。数据集提供了包含重复对称结构的典型场景(如,高速铁路的轨道),为铁路轨道三维模型重建和铁路安全运营等应用提供了合适的实验数据。
WHU-TLS山区数据集采用Leica ScanStation C5地面站激光扫描系统获取,包含6个测站,共计约0.2亿个点。WHU-TLS山区数据集由非结构化的岩石和草地组成。该数据集在跨度较大的两个时段采集(测站1—4在3月采集,测站5—6在8月采集),由于季节性变化以及人为采石等因素的影响,导致数据之间存在明显的变化,增加了相邻点云配准的难度。该数据集为多时项点云配准以及滑坡监测算法提供了适用的测试数据集。
WHU-TLS公园数据采用RIEGL VZ-400地面站激光扫描系统获取,包含32个测站,共计1.6亿个点。该数据集混合了人造结构(如建筑物、道路和护栏)和自然特征(如树木、灌木、山脉、河流和草地),属于典型的半结构化场景。
WHU-TLS校园数据集采用RIEGL VZ-400 TLS地面站激光扫描系统获取,包含10个测站,共计约1.1亿个点。该场景由混合的结构化元素(如建筑、道路、柱子和楼梯)和非结构化特征(如树木、雕塑和草地)组成,属于典型的半结构化场景。数据采集过程中移动的车辆和行人给配准算法的鲁棒性带来了挑战。
WHU-TLS住宅数据集采用Leica ScanStation P40地面站激光扫描系统获取,包含7个测站,共计约0.4亿个点。加快了加快数据采集效率,扩大了两个相邻扫描之间的距离,导致相邻点云之间的重叠度很低(如点云1和点云6之间的重叠仅为为1.0%左右)。此外,住宅数据集包含许多重复的结构(如窗户)和对称性的布局,进一步增加了点云配准的难度。
WHU-TLS河流数据集采用RIEGL VZ-400地面站激光扫描系统获取,包含7个测站,共计约0.9亿个点。该场景由混合的结构化元素(如桥梁和道路)和非结构化特征(如树木和草地)组成。大部分激光脉冲被水吸收,在水面区域产生数据“空洞”,部分激光脉冲会被水反射产生“虚拟点”。河流数据集的目的是验证数据空洞孔和“虚拟点”对配准算法性能的影响,同时也为河流调查和治理应用提供了一个合适的数据集。
WHU-TLS古建筑数据集采用RIEGL VZ-400地面站激光扫描系统和5D Mark II相机获取,包含9个测站,共计约2.4亿个点。WHU-TLS古建筑数据集包含了非结构化的特征(如屋顶挑廊和瓦片),为古建筑的三维模型重建和文化遗产数字化保护提供了合适的验证数据。
WHU-TLS地下矿道数据集采用RIEGL VZ-400地面站激光扫描系统获取,包含12个测站,共计约4.8亿个点。WHU-TLS地下矿道数据集主要由非结构化的裸露岩石组成,裸露的岩石具有重复和对称的特征,增加了配准的难度。该数据集也为地下洞窟三维模型重建和地下资产管理应用提供了合适的数据集。
WHU-TLS隧道数据集采用RIEGL VZ-400地面站激光扫描系统和5D Mark II相机获取,包含7个测站,共计约1.6亿个点。WHU-TLS隧道数据集由重复和对称的结构(如地面和墙上的瓦片)和弱几何特征(如隧道的屋顶)组成,增加了同名点选择的不确定性。此外,两个扫描站之间的基线较长,导致相邻点云之间的重叠度较低(如点云4和5之间的重叠度小于6.0%)。同时,单向扫描和线性布局的测站容易导致配准误差的积累,进一步加大了WHU-TLS隧道数据集配准的困难性。
准确高效地城市场景理解在高清地图、无人驾驶、三维重建和智慧城市等方面起着非常重要的作用(
点云语义分割是为点云中的每一个点赋予一个标签,对三维场景的理解具有非常重要的意义(
基于此,武汉大学与上海市测绘院合作发布了WHU-MLS基准数据集,标注了城区车载点云语义和实例两个层次的高质量信息,为语义分割和实例分割的训练、测试和评估提供了基准参考,服务于高清地图、无人驾驶、智慧城市和虚拟现实等前沿应用。和现有公开的点云深度学习数据集相比,WHU-MLS数据集有如下主要特点:
(1)大规模城市场景数据,具有城市场景点云密度大、分布不均、数据不完备等典型特点;
(2)采用逐点级别对若干典型地物进行高质量标注,类别达30余种,可满足语义分割的需求,每一个语义标签值代表一个类别信息。如
(3)实例层次标注可以区分同一类别中不同对象或实例。实例标签值不具有特定意义,仅用于判断是否属于同一实例,即同一个实例的点云具有相同的实例标签,所属不同实例的点云具有不同的实例标签。如
该数据集可通过公开数据集网站
WHU-MLS语义层面的标注包含6大类,30余小类。其中包括地面特征(机动车道、道路标线、井盖、非机动车道和其他地面点),动态目标(行人以及车辆),植被(树木、树丛、低矮植被和花坛),杆状地物及其附属结构(电线杆、独立提示牌、路灯、信号灯、市政立杆、独立探头以及杆状结构的附属结构),建筑和结构设施(房屋、景观建筑、道路隔离结构、围墙和栅栏)以及其他公共和便利设施(垃圾桶、邮筒、消防栓、街头座椅、箱状地物、电力线、棚子、公交站牌(台)、石墩等)。实例层次标注的有:房屋建筑类、景观建筑类、树木、路灯、电线杆、杆状结构附属物、独立提示牌、机动车、行人和非机动车、石墩、花坛、垃圾桶、井盖等。
WHU-MLS标注部分类别说明
类别 | 说明 | 包含结构 |
---|---|---|
房屋建筑类 | 住宅(楼)、办公房(楼)、商业房(楼)、图书馆等及其附属物(如室外楼梯) | 房屋的所有结构、房屋内所有结构、房屋附属结构, |
景观建筑类 | 校门、长廊、雕塑、亭/塔等建筑 | 完整的建筑结构 |
树木 | 可区分的单棵树木 | 树干、枝叶,不包括树木下面的树坛 |
树丛 | 不可区分单棵的成片树木 | 全部树干、枝叶,不包括树木下面的树坛 |
路灯 | 道路周边的照明路灯 | 灯杆和灯的全部结构,不包括附属结构 |
电线杆 | 电线杆 | 电线杆及架线结构,不包括电线及其他附属结构 |
路灯附属物 | 路灯灯杆附属物,如摄像头 | 附属结构但不包括提示牌、广告牌 |
电线杆附属物 | 电线杆附属物如照明灯 | 附属结构但不包括提示牌、广告牌、电线 |
附属提示牌、广告牌 | 附属于路灯或电线杆的提示牌和广告牌 | 标牌及与灯杆、电线杆的连接结构 |
独立提示牌 | 不附属于路灯或电线杆的提示牌,如交通提示牌 | 提示牌、提示牌的支撑结构以及其所有附属结构 |
机动车 | 机动车,如轿车、卡车、公交车等 | 完整交通工具结构 |
行人、非机动车 | 行人、自行车、摩托车、三轮车等 | 行人及其附属物(比如手提袋、背包、自行车等)所有结构、交通工具所有结构 |
道路隔离结构 | 道路与道路之间的实体隔离结构如护栏、花坛等 | 道路与道路之间的实体隔离结构如护栏、花坛等 |
花(草)坛 | 街道摆放的小盆栽以及灌木丛 | 植被结构及其容器结构 |
独立棚子 | 公交站台棚子、街头的雨棚等 | 棚子的完整结构,包括支撑结构等 |
WHU-MLS中各类别标注情况
类别 | 地面 | 植被 | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
机动车道 | 标线 | 井盖 | 非机动车道 | 其他地面 | 树木 | 树丛 | 低矮植被 | 花坛 | ||||
总点数 | 174927236 | 9794256 | 107155 | 15568322 | 5088151 | 42115622 | 20785700 | 11460379 | 1786664 | |||
实例个数 | — | — | 111 | — | — | 1979 | — | — | 170 | |||
包含场景数 | 40 | 35 | 15 | 36 | 24 | 40 | 40 | 37 | 24 | |||
类别 | 类别 | 杆状及其附属设施 | ||||||||||
电线杆 | 独立提示牌 | 路灯 | 信号灯 | 市政立杆 | 附属提示牌 | 电线杆附属物 | 路灯附属物 | 独立探头 | ||||
总点数 | 174916 | 349280 | 464678 | 239113 | 11243 | 27136 | 1763 | 14246 | 203334 | |||
实例个数 | 61 | 224 | 327 | 111 | 282 | 85 | 9 | 13 | 59 | |||
包含场景数 | 21 | 38 | 39 | 23 | 21 | 26 | 4 | 3 | 27 | |||
类别 | 动态目标 | 其他设施 | ||||||||||
行人 | 车辆 | 垃圾桶 | 邮筒 | 消防栓 | 街头座椅 | 箱状地物 | 电力线 | 独立棚子 | ||||
总点数 | 1141249 | 9865409 | 108171 | 2301 | 3321 | 4865 | 107621 | 63725 | 53668 | |||
实例个数 | 1355 | 710 | 113 | 4 | 23 | 4 | 81 | — | 7 | |||
包含场景数 | 39 | 39 | 28 | 3 | 14 | 3 | 26 | 20 | 6 | |||
类别 | 其他设施 | |||||||||||
公交站牌 | 公交站台 | 石墩 | 其他 | |||||||||
总点数 | 35296 | 38961 | 75336 | 101248 | ||||||||
实例个数 | 24 | 9 | 49 | — | ||||||||
包含场景数 | 11 | 5 | 4 | 12 |
相比于大量发布的图像深度学习基准数据集,供点云深度学习的基准数据集的规模和类别相对较少。为推动点云深度学习等方面的发展,武汉大学和国内外多家单位合作,推出了迄今为止最大规模的WHU-TLS配准数据集和类别最多的WHU-MLS语义/实例分割数据集,为点云深度学习网络的训练、测试和评估提供了十分重要的参考,该数据集旨在鼓励中国学者使用自己的数据开展相关的研究,同时解决从事点云研究人员缺少数据的问题。此外,该基准数据集也为从事点云应用研究,如:文化遗产保护、地下资产管理、无人驾驶等,提供了代表性的数据。