基于体素特征重组网络的三维物体识别

doi:10.11996/JG.j.2095-302X.2019020240

图学学报

• 专论：第12届中国计算机图形学大会 (CHINAGRAPH 广州) • 上一篇下一篇

基于体素特征重组网络的三维物体识别

1. 合肥工业大学计算机与信息学院 VCC 研究室，安徽合肥 230601；
2. 工业安全与应急技术安徽省重点实验室(合肥工业大学)，安徽合肥 230009；
3. 北德克萨斯大学计算机科学与工程学院，德克萨斯丹顿 76201

出版日期:2019-04-30 发布日期:2019-05-10
基金资助:
安徽省自然科学基金项目(1708085MF158)；国家自然科学基金项目(61602146)；国家留学基金项目(201706695044)；合肥工业大学智能制造技术研究院科技成果转化及产业化重点项目(IMICZ2017010)

3D Object Recognition Based on Voxel Features Reorganization Network

1. VCC Division, School of Computer and Information, Hefei University of Technology, Hefei Anhui 230601, China;
2. Anhui Province Key Laboratory of Industry Safety and Emergency Technology (Hefei University of Technology), Hefei Anhui 230009, China;
3. Department of Computer Science and Engineering, University of North Texas, Denton TX 76201, United States

Online:2019-04-30 Published:2019-05-10

摘要/Abstract

摘要： 三维物体识别是计算机视觉领域近年来的研究热点，其在自动驾驶、医学影像处理等方面具有重要的应用前景。针对三维物体的体素表达形式，特征重组卷积神经网络 VFRN 使用了直接连接同一单元中不相邻的卷积层的短连接结构。网络通过独特的特征重组方式，复用并融合多维特征，提高特征表达能力，以充分提取物体结构特征。同时，网络的短连接结构有利于梯度信息的传播，加之小卷积核和全局均值池化的使用，进一步提高了网络的泛化能力，降低了网络模型的参数量和训练难度。ModelNet 数据集上的实验表明，VFRN 克服了体素数据分辨率低和纹理缺失的问题，使用较少的参数取得了优于现有方法的识别准确率。

关键词: 物体识别, 体素, 卷积神经网络, 特征重组, 短连接

Abstract: 3D object recognition is a research focus in the field of computer vision and has significant application prospect in automatic driving, medical image processing, etc. Aiming at voxel expression form of 3D object, VFRN (voxel features reorganization network), using short connection structure, directly connects non-adjacent convolutional layers in the same unit. Through unique feature recombination, the network reuses and integrates multi-dimensional features to improve the feature expression ability to fully extract the structural features of objects. At the same time, the short connection structure of the network is conducive to the spread of gradient information. Additionally, employing small convolution kernel and global average pooling not only enhances generalization capacity of network, but also reduces the parameters in network models and the training difficulty. The experiment on ModelNet data set indicates that VFRN overcomes problems including low resolution ratio in voxel data and texture deletion, and achieves better recognition accuracy rate using less parameter.

Key words: object recognition, voxel, convolution neural network, feature reorganization, short connection

路强 1,2，张春元 1，陈超 1，余烨 1,2， YUAN Xiao-hui3 . 基于体素特征重组网络的三维物体识别[J]. 图学学报, DOI: 10.11996/JG.j.2095-302X.2019020240.

LU Qiang1,2, ZHANG Chun-yuan1, CHEN Chao1, YU Ye1,2, YUAN Xiao-hui3 . 3D Object Recognition Based on Voxel Features Reorganization Network[J]. Journal of Graphics, DOI: 10.11996/JG.j.2095-302X.2019020240.

[1]	张盾, 黄志开, 王欢, 吴义鹏, 王颖, 邹家豪. 基于多尺度特征实现超参进化的野生菌分类研究与应用[J]. 图学学报, 2022, 43(4): 580-589.
[2]	廖志伟, 金兢, 张超凡, 杨学志. 基于分层压缩激励的 ASPP 网络单目深度估计[J]. 图学学报, 2022, 43(2): 214-222.
[3]	苏常保, 龚世才. 基于深度学习的人物肖像全自动抠图算法[J]. 图学学报, 2022, 43(2): 247-253.
[4]	何国忠, 梁宇. 基于卷积神经网络的 PCB 缺陷检测[J]. 图学学报, 2022, 43(1): 21-27.
[5]	汪玉金, 谢诚, 余蓓蓓, 向鸿鑫, 柳青. 属性语义与图谱语义融合增强的零次学习图像识别[J]. 图学学报, 2021, 42(6): 899-907.
[6]	张成 , 侯宇超 , 焦宇倩 , 白艳萍 , 李建军 . 基于三通道分离特征融合与支持向量机的混凝土图像分类研究[J]. 图学学报, 2021, 42(6): 917-923.
[7]	马欢, 冀晶晶, 刘佳豪, 刘雨婷. 面向机器人自主分割的肉品识别分类系统实现[J]. 图学学报, 2021, 42(6): 924-930.
[8]	封筠 , 赵颖 , 毕健康 , 赖柏江 , 胡晶晶 . 多级卷积神经网络的沥青路面裂缝图像层次化筛选[J]. 图学学报, 2021, 42(5): 719-728.
[9]	张明华 , 牛玉莹 , 杜艳玲 , 黄冬梅 , 刘刻福 . 基于残差 3DCNN 和三维 Gabor 滤波器的高光谱图像分类[J]. 图学学报, 2021, 42(5): 729-737.
[10]	满开亮, 汪友生, 刘继荣. 基于稠密残差网络的图像超分辨率重建算法[J]. 图学学报, 2021, 42(4): 556-562.
[11]	张鹏飞 , 石志良 , 李晓垚 , 欧阳祥波 . 基于深度学习的主轴承盖分类识别算法[J]. 图学学报, 2021, 42(4): 572-580.
[12]	官申珂, 林晓, 郑晓妹, 朱媛媛, 马利庄 . 结合超像素分割的多尺度特征融合图像语义分割算法 [J]. 图学学报, 2021, 42(3): 406-413.
[13]	林晓 , 屈时操 , 黄伟 , 郑晓妹 , 马利庄 . 显著区域保留的图像风格迁移算法[J]. 图学学报, 2021, 42(2): 190-197.
[14]	刘尚武 , 魏巍 , 段晓东 , 刘勇奎 . 三维模型有向三角面片链码压缩方法[J]. 图学学报, 2021, 42(2): 237-244.
[15]	黄欢 , 孙力娟 , 曹莹 , 郭剑 , 任恒毅 . 基于注意力的短视频多模态情感分析[J]. 图学学报, 2021, 42(1): 8-14.

基于体素特征重组网络的三维物体识别

3D Object Recognition Based on Voxel Features Reorganization Network

PDF (PC)

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价