基于层级边缘卷积的三维点云分类
朱慧
1,2
,吴晓群
1,2
(1. 北京工商大学计算机与信息工程学院,北 京 100048;2. 北京工商大学食品安全大
数据技术北京市重点实验室,北京 100048)
摘 要:由于激光点云数据的无序性、离散性、稀疏性,基于深度学习的三维点云数据的特征提取具有一
定难度。针对目前局部信息提取不充分,区域信息的合并有限的问题,提出了一种基于层级边缘卷积的点
云分类网络,用于三维视觉中点云模型识别任务。本文采用层级结构的思想,通过层级几何信息模块对特
征进行有效提取和归纳。对于每个层级几何信息提取模块,首先对点云模型进行下采样并构建局部区域,
对每个局部区域中点与点之间的距离和特征进行建模,获得局部区域的几何信息,最后聚合多个采样点的
局部结构特征。实验结果表明,本算法在 ModelNet40 数据集上的识别准确率为 91.5%。与已有的三维点云
模型识别分类算法相比,本文算法能够更充分地提取局部信息,进一步提高三维点云模型分类的准确率。
关键词:三维深度学习;三维感知;点云分类;几何特征;信息聚合;边缘向量
中图分类号:TP 391 文献标志码:A
Hierarchical edge-convolution network for 3D point cloud
classification
Zhu Hui
1,2
, WU Xiaoqun
1,2
(1. School of Computer and Information Engineering, Beijing Technology and Business University,
Beijing 100048, China; 2. Beijing Key Laboratory of Big Data Technology for Food Safety,
Beijing Technology and Business University, Beijing 100048, China)
Abstract:It is difficult to extract the features of 3D point cloud data based on deep learning due to the
unstructured and discrete properties of point cloud. In this paper, we propose a hierarchical edge convolution
network for point cloud classification to address the insufficient local information extraction and region merging
information problems. Inspired by the information abstract ability of hierarchical structure, we use level of
geometric extraction module to extract and abstract information. For each level of geometric information
extraction module, firstly, the point cloud model is downsampled and the local areas are constructed. Then, the
geometric information of the local area is obtained according the distant and features among the points in the local
area. Finally, the local structure features of multiple sampling points are aggregated. After the effective induction
of local area information by hierarchical structure, the classification of point cloud model is predicted. The
experimental results show that the recognition accuracy of this algorithm is 91.5% on the data set of modelnet40.
Compared with the existing three-dimensional point cloud model recognition and classification algorithm, this
algorithm can extract local information more fully and further improve the accuracy of three-dimensional point
cloud model classification.
Keywords:3D deep learning, 3D perception, point cloud classification, geometric features, information
aggregation, edge vector
深度学习在图像处理领域的大获成功,特别是图像识别
[1][2][3]
任务上取得了很大进展。
但由于人们的视觉感知系统具有三维立体特性,并且三维模型及其组成的三维场景能提供比
二维图像更多、更丰富的视觉感知细节,所以基于二维图像的场景感知技术已经无法满足现
代科技的需要。人们对自动驾驶
[4]
、虚拟现实
[5]
、增强现实
[6]
、机器人
[7]
等应用的 3D 视觉
技术领域兴趣日益增长。随着激光扫描等技术趋于成熟,点云数据不断增长,催化了使用数
据驱动方法来从点云学习特征的研究。
将深度学习方法从二维图像直接扩展到三维识别任务中是存在一定问题的,由于常规的
深度网络的输入都是规则结构的数据,而点云则是利用结构光扫描仪或者三维激光扫描仪等
设备采集到的分布在三维空间中的离散点集,是无序的,对不规则点集直接应用卷积操作来
收稿日期:2019-11-19
基金项目:国家自然科学基金资助项目(61602015);北京市教委科技一般项目(KM201910011012);“十三
五”时期北京市属高校高水平教师队伍建设支持计划(CIT&TCD201904036)
第一作者:朱慧(1996—),女,研究生,主要研究方向为计算机图形学
通信作者:吴晓群,副教授,主要研究方向为计算机图形学,wuxiaoqun@btbu.edu.cn