欢迎访问《图学学报》 分享到:
双月刊,创刊于1980年
主管单位:中国科学技术协会
主办单位:中国图学学会
编辑出版:《图学学报》编辑部
主  编:汪国平
编辑部主任:侯晓红
ISSN 2095-302X
CN 10-1034/T
当期目录
2024年, 第45卷, 第1期 刊出日期:2024-02-29 上一期   
全选选: 隐藏/显示图片
封面
2024年第1期封面
2024, 45(1): 0. 
PDF 34     121
相关文章 | 计量指标
目次
2024年第1期目次
2024, 45(1): 0. 
PDF 29     86
相关文章 | 计量指标
综述
神经辐射场加速算法综述
王稚儒, 常远, 鲁鹏, 潘成伟
2024, 45(1): 1-13.  DOI: 10.11996/JG.j.2095-302X.2024010001
HTML    PDF 63     54

近年来,神经辐射场(NeRF)已成为计算机图形学和计算机视觉领域中一个重要的研究方向,因其高逼真的视觉合成效果,在真实感渲染、虚拟现实、人体建模、城市地图等领域得到了广泛的应用。NeRF利用神经网络从输入图片集中学习三维场景的隐式表征,并合成高逼真的新视角图像。然而原始NeRF模型的训练和推理速度都很慢,难以在真实环境下部署与应用。针对NeRF的加速问题,研究者们从场景建模方法、光线采样策略等方面展开对NeRF进行提速的研究。该类工作大致可分为以下研究方向:烘焙模型、与离散表示方法结合、提高采样效率、利用哈希编码降低MLP网络复杂度、引入场景泛化性、引入深度监督信息和分解方法。通过介绍NeRF模型提出的背景,对上述思路的代表方法的优势与特点进行了讨论和分析,最后总结了NeRF相关工作在加速方面所取得的进展和对于未来的展望。

数据和表 | 参考文献 | 相关文章 | 计量指标
动态三维场景重建研究综述
黄家晖, 穆太江
2024, 45(1): 14-25.  DOI: 10.11996/JG.j.2095-302X.2024010014
HTML    PDF 52     54

三维重建技术旨在通过传感器输入,恢复所观测场景的数字化三维表示,是计算机图形学与视觉领域的重要研究方向,在可视化、模拟、路线规划等各类任务上都有重要应用。相比于静态场景,动态场景额外引入了时间维度,对应的重建任务不仅需要重构每帧细节几何,还需刻画目标随着时间变化的趋势与关联关系用于下游分析任务,为重建算法设计带来了更大的挑战。然而,目前学界就动态场景重建的讨论依然仅处于起步阶段,且关于现有方法的系统性总结也较为欠缺。为了填补上述空缺、进一步启发算法设计,对学界当前最新的动态三维场景重建技术进行整理和归纳,对动态三维场景重建问题及其通用求解框架进行一般性的定义,从动态三维表示方式、优化框架方面对已有技术进行综述,并针对结构化的特殊场景讨论对应的重建方法与处理方式。最终,介绍相关数据集,并对动态三维场景重建现存的问题进行分析总结,对未来工作进行展望。

数据和表 | 参考文献 | 相关文章 | 计量指标
图像处理与计算机视觉
基于语义引导神经网络的人体动作识别算法
郭宗洋, 刘立东, 蒋东华, 刘子翔, 朱熟康, 陈京华
2024, 45(1): 26-34.  DOI: 10.11996/JG.j.2095-302X.2024010026
HTML    PDF 26     58

近年来,采用深度前馈神经网络对骨骼关节的三维坐标建模成为了一种趋势。但网络识别准确率低、巨大的参数量以及实时性差仍然是基于骨骼数据动作识别领域中急需解决的问题。为此,提出一种基于语义引导神经网络(SGN)改进的网络模型。首先,在原网络中引入了非局部特征提取模块用于增强其在高级语义指导模型训练和预测的表现,降低了其在自然语言处理任务中的计算复杂性和推理时间;其次,引入注意力机制学习每个图卷积网络层的通道权重并减少通道间的冗余信息,进一步提高模型的计算效率和识别准确率;此外,以可变形卷积模块动态学习不同图卷积网络(GCN)层通道的权重,并有效地聚合不同通道中的关节特征用于网络最后的分类识别,从而提高特征信息的利用率。最后,在NTU RGB+D和NTU RGB+D 120公开数据集上进行人体动作识别实验。实验结果表明,所提出的网络比大多数网络小一个数量级,并且在识别准确率上明显优于原网络和其他一些先进的算法。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于YOLO轻量化的多模态行人检测算法
苑朝, 赵亚冬, 张耀, 王嘉璇, 徐大伟, 翟永杰, 朱松松
2024, 45(1): 35-46.  DOI: 10.11996/JG.j.2095-302X.2024010035
HTML    PDF 62     76

针对低光照环境下行人检测精度低和模型参数量大的问题,基于YOLO框架,提出一种轻量化的多模态行人检测算法EF-DEM-YOLO。采用轻量的ES-MobileNet作为主干特征提取网络,并在该网络中引入ECA和SE-ECA注意力机制模块,增强重要的通道特征,提高小目标行人的检测精度。在颈部网络中设计了基于深度可分离卷积的DBL模块,进一步缩减模型的参数量。另外,为了提高低光照条件下行人的检测精度,利用可见光模态和红外模态在不同光照条件下特征互补的特点,提出了基于图像熵的可见光与红外模态加权融合方法,并设计了融合模块EWF。相比与基准方法,该算法对于不同光照条件下的行人目标,模型的mAP提高55.5%,MR降低85.9%,模型的推理速度达到33.4帧/秒,并且均优于其他经典的目标检测算法,为边缘计算和低光照场景下的行人目标的实时检测提供了可能。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于融合MBAM与YOLOv5的PCB缺陷检测方法
胡欣, 胡帅, 马丽军, 司利云, 肖剑, 袁晔
2024, 45(1): 47-55.  DOI: 10.11996/JG.j.2095-302X.2024010047
HTML    PDF 58     49

随着电子信息产业迅速发展,PCB行业作为电子信息产业的基础,其产品质量对后续生产的电子产品有着决定性影响。针对PCB缺陷目标较小,缺陷类型多,特征不明显,在实际生产过程中易产生误检、漏检等问题,提出了一种多分支注意力MBAM模块方法,在3个不同维度对特征图进行关注,以增强特征提取的能力,对缺陷区域给予更多的注意力表示。通过改进YOLOv5结构,将MBAM与YOLOv5网络结合,有效的提升了对PCB中小目标的检测性能。最后通过在网络不同位置添加MBAM模块进行对比实验,选取了最佳的添加位置。通过在PCB缺陷数据集上的实验结果表明,改进后的PCB缺陷检测算法具有良好的检测性能,优于其他对比算法,最终的AP达到了96.7%,对比标准YOLOv5的94.7%提高了2个百分点,其他项指标均有涨点,在保持检测速度基本不变的情况下,精准地识别PCB缺陷类型。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于增强特征提取网络与语义特征融合的多方向文本检测
吕伶, 李华, 王武
2024, 45(1): 56-64.  DOI: 10.11996/JG.j.2095-302X.2024010056
HTML    PDF 25     20

针对自然场景文本长度不定、角度倾斜等难题,提出了一种基于增强特征提取网络与语义特征融合的文本检测方法。通过结合可变形卷积与空洞卷积,设计了一种增强扩张残差模块EDRM (Enhanced Dilated Residual Module),将其应用于ResNet18的conv4_x与conv5_x层,并以此作为骨干网络,在改善网络特征提取能力的同时提高特征图像分辨率,减少空间信息丢失。其次,针对现有算法提取文本语义特征仍不充分的问题,将双向长短期记忆网络BiLSTM (Bi-directional Long Short-Term Memory)引入特征融合部分,增强融合特征图对自然场景文本的表征能力以及特征序列的关联性,同时提高模型的文本定位能力。在多方向文本数据集ICDAR2015、长文本数据集MSRA-TD500上对模型展开评估,实验结果表明,该算法与当下高效的DBNet算法相比,F值分别提升1.8%、3.3%,表现出良好的竞争力。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于高低频特征分解的深度多模态医学图像融合网络
王欣雨, 刘慧, 朱积成, 盛玉瑞, 张彩明
2024, 45(1): 65-77.  DOI: 10.11996/JG.j.2095-302X.2024010065
HTML    PDF 17     16

多模态医学图像融合旨在利用跨模态图像的相关性和信息互补性,以增强医学图像在临床应用中的可读性和适用性。然而,现有手工设计的模型无法有效地提取关键目标特征,从而导致融合图像模糊、纹理细节丢失等问题。为此,提出了一种新的基于高低频特征分解的深度多模态医学图像融合网络,将通道注意力和空间注意力机制引入融合过程,在保持全局结构的基础上保留了局部纹理细节信息,实现了更加细致的融合。首先,通过预训练模型VGG-19提取两种模态图像的高频特征,并通过下采样提取其低频特征,形成高低频中间特征图。其次,在特征融合模块嵌入残差注意力网络,依次从通道和空间维度推断注意力图,并将其用来指导输入特征图的自适应特征优化过程。最后,重构模块形成高质量特征表示并输出融合图像。实验结果表明,该算法在Harvard公开数据集和自建腹部数据集峰值信噪比提升8.29%,结构相似性提升85.07%,相关系数提升65.67%,特征互信息提升46.76%,视觉保真度提升80.89%。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于Transformer的三角形网格分类分割网络
李佳琦, 王辉, 郭宇
2024, 45(1): 78-89.  DOI: 10.11996/JG.j.2095-302X.2024010078
HTML    PDF 28     21

三角形网格是一种重要的几何数据结构,能有效地表达三维模型的形状细节,但三角形网格面元素的分布并不规则,因此将现有的深度神经网络直接应用到网格上较为困难。针对三角形网格不规则的结构问题,直接将网格的面作为Token,提出一种将Transformer应用于三角形网格的深度神经网络。首先,将面的重心坐标或谱域特征作为位置信息,融合其内蕴特征作为输入特征,并对输入特征位置嵌入;其次,利用自注意力模块提取全局特征,利用面卷积模块提取局部特征,以增强网络局部特征的提取能力;最后,融合局部特征和全局特征构建应用于三角形网格上的分类和分割深度神经网络。在SHREC分类数据集和COSEG分割数据集上的实验结果表明,该方法准确率较高且可以有效地提升训练速度。

数据和表 | 参考文献 | 相关文章 | 计量指标
IDD-YOLOv7:一种用于输电线路绝缘子多缺陷的轻量化检测方法
翟永杰, 赵晓瑜, 王璐瑶, 王亚茹, 宋晓轲, 朱浩硕
2024, 45(1): 90-101.  DOI: 10.11996/JG.j.2095-302X.2024010090
HTML    PDF 42     41

YOLO目标检测算法是当前基于图像的输电线路绝缘子缺陷检测的主流方法,然而现有模型复杂度较大,亟需合理有效的参数压缩方法作为前提条件,来为解决无人机边缘设备部署的困境问题奠定基础;同时,无人机航拍的绝缘子缺陷图像背景复杂、缺陷尺寸较小,容易出现误检、漏检等问题。为此,提出了一种用于输电线路绝缘子多缺陷检测的Insulator Defect Detection-YOLOv7(IDD-YOLOv7)模型,以降低模型复杂度,提高模型鲁棒性。首先,在多尺度特征融合的过程中加入坐标注意力(Coordinate Attention)机制,抑制复杂背景的干扰,提升模型对小目标的全局感知能力;之后,设计C3GhostNetV2模块,用于捕获不同空间像素之间的远程依赖性,在增强模型表达能力的同时降低模型的参数量和浮点运算量;最后,提出Focal-CIoU损失函数,提高模型高质量anchor的贡献,加快模型的收敛速度。实验结果表明,本文方法与基线模型相比mAP50提升了3.8%,查准率和召回率分别提升了1.7%和7.6%,参数量和浮点运算量分别下降了18.3%和14.0%,绝缘子自爆、破损、闪络缺陷的AP50分别提升了0.8%、4.5%、6.3%。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于SASGAN的戏剧脸谱多样化生成
古天骏, 熊苏雅, 林晓
2024, 45(1): 102-111.  DOI: 10.11996/JG.j.2095-302X.2024010102
HTML    PDF 17     13

为解决现有自动生成的戏剧脸谱在分辨率和真实性上效果不佳的问题,提出了基于自注意力机制的风格化生成对抗网络(SASGAN)。首先在StyleGAN的基础上引入了自注意力机制以及矢量量化方法,增强了对脸谱图案几何结构特征的提取,接着通过多样化差异性增强(DDG)扩充数据,采用脸谱色调辅助算法对DDG方法进行补充,建立了包含12 599张图像的戏剧脸谱数据集,最后在此数据集上进行训练,生成了兼顾多样性和真实性的脸谱图像。实验结果表明,对于戏剧脸谱图像,DDG方法较传统方法在数据增广方面有着较大提升,而SASGAN则提升了戏剧脸谱图像的分辨率和真实性,在主观视觉上得到了理想的效果。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于MCB-FAH-YOLOv8的钢材表面缺陷检测算法
崔克彬, 焦静颐
2024, 45(1): 112-125.  DOI: 10.11996/JG.j.2095-302X.2024010112
HTML    PDF 64     48

针对现有基于深度学习的钢材表面缺陷检测算法存在误检、漏检和检测精度低等问题,提出一种基于改进CBAM(modified CBAM,MCB)和可替换四头ASFF预测头(four-head ASFF prediction head,FAH)的YOLOv8钢材表面缺陷检测算法,简记为MCB-FAH-YOLOv8。通过加入改进后的卷积注意力机制模块(CBAM)对密集目标更好的确定;通过将FPN结构改为BiFPN更加高效的提取上下文信息;通过增加自适应特征融合(ASFF)自动找出最适合的融合特征;通过将SPPF模块替换为精度更高的SimCSPSPPF模块。同时,针对微小物体检测,提出了四头ASFF预测头,可根据数据集特点进行替换。实验结果表明,MCB-FAH-YOLOv8算法在VOC2007数据集上检测精度(mAP)达到了88.8%,在NEU-DET钢铁缺陷检测数据集上检测精度(mAP)达到了81.8%,较基准模型分别提高了5.1%和3.4%,该算法在牺牲较少检测速度的情况下取得较高的检测精度,很好的平衡了算法的精度和速度。

数据和表 | 参考文献 | 相关文章 | 计量指标
铜凿剪纸风格化方法研究
周磊晶, 张雨昕, 雷睿, 申奥怡
2024, 45(1): 126-138.  DOI: 10.11996/JG.j.2095-302X.2024010126
HTML    PDF 5     10

铜凿剪纸是一种在铜箔上凿点并使用矿物质颜料上色的传统艺术形式,其成品光彩夺目。铜凿剪纸工艺复杂、制作时间长,对手工艺人的技术水平有很高的要求。为此,提出了一种铜凿剪纸风格化的方法,并设计、实现了一种计算机辅助铜凿剪纸设计工具,通过生成图像线稿、凿点图以及铜凿剪纸效果图,帮助手工艺人快速完成铜凿剪纸的创作和制作。将输入图像进行区域分割以提取图像的线条,生成图像线稿;定义了一种颜色损失函数,结合贪心算法和梯度下降法求解函数最小值得到最佳颜色映射方案;基于VGG-19网络对图像线条进行风格迁移,生成凿点图;将线条风格迁移图像与颜色迁移图像进行融合,生成铜凿剪纸效果图;基于PyQt5框架开发铜凿剪纸设计工具,设计了交互平台。实验结果表明,该方法能够实现图像的铜凿剪纸风格化,且效果接近真实的铜凿剪纸,支持手工艺人快速生成工艺流程中需要的图像线稿、凿点图以及效果图等相关材料,提高铜凿剪纸的制作效率,具有较高的应用价值。

数据和表 | 参考文献 | 相关文章 | 计量指标
计算机图形学与虚拟现实
面向线束预装配的多约束线束布局方法研究
罗月童, 彭俊, 高景一, 罗睿明, 陈绩, 周波
2024, 45(1): 139-147.  DOI: 10.11996/JG.j.2095-302X.2024010139
HTML    PDF 7     10

线束由一组线束段按树状结构连接而成,是飞机汽车等产品中连接各电气设备的接线部件。为提高安装效率,复杂线束需要在线束工装板图上进行预安装,即根据角度、距离、交叉、边界等工艺约束在工装板上摆放线束,是一个多约束下的线束布局问题。通过借鉴图布局算法,将线束布局转换为优化问题,并采用随机梯度下降法SGD每次随机挑选一对线束段进行优化,逐步迭代收敛。因为线束段是长度不变的刚体,所以移动一根线束段时会带动相连的其他线束段,进而导致SGD迭代过程出现震荡,难以收敛。通过提出双向传递的线束段移动算法,在保证线束段能移动到目标位置的同时尽量少相连线束段的变动。使用合成线束案例和某真实飞机线束案例进行有效性验证,结果表明各工艺约束能均能得到满足,符合线束预装配的生产要求。

数据和表 | 参考文献 | 相关文章 | 计量指标
一种带高光处理的无缝纹理映射方法
石敏, 王炳祺, 李兆歆, 朱登明
2024, 45(1): 148-158.  DOI: 10.11996/JG.j.2095-302X.2024010148
HTML    PDF 5     13

纹理映射作为三维重建的重要步骤,直接关系到生成模型的视觉效果。传统的纹理映射方法通常使用简单的混合方法来获取表面纹理。通过将模型表面投影到每个纹理图像上来获取相应的纹理区域,然后将它们混合在一起以获取表面纹理。然而,由于相机位姿的不准确性,纹理映射结果存在明显的模糊和鬼影等问题。此外,在高光环境下获取的纹理图像很容易包含高光区域,最终导致纹理颜色的丢失,降低纹理的真实性。为了解决这些问题,提出了一种无缝纹理映射方法,可以有效消除高光反射。通过衡量纹理图像的质量,为每个模型表面选择最佳的纹理图像,并利用色度一致性约束优化的相机位姿以消除明显的纹理错位。针对高光问题,提出了一个高光处理模块,使用多视图图像信息并基于双色反射模型定位和处理高光纹理。最后,对纹理图进行纹理颜色一致性调整,以处理纹理之间的颜色差异。实验结果表明,与现有方法相比,提出的算法可以有效消除高光反射的影响,从而获得更好的纹理映射结果。

数据和表 | 参考文献 | 相关文章 | 计量指标
一种基于时空运动信息交互建模的三维人体姿态估计方法
吕衡, 杨鸿宇
2024, 45(1): 159-168.  DOI: 10.11996/JG.j.2095-302X.2024010159
HTML    PDF 14     20

三维人体姿态估计在虚拟现实和人机交互等领域具有重要作用。近年来,Transformer已被引入三维人体姿态估计领域,用于捕捉人体关节点的时空运动信息。然而,现有研究通常只关注于人体关节点群的整体运动,或只对单独的人体关节点运动进行建模,均没有深入地探讨每个关节点的独特运动模式及不同关节点运动间的相互影响。因此,提出了一种创新的方法,旨在细致地学习每帧中的二维人体关节点的空间信息,并对每个关节点的特定运动模式进行深入分析。通过设计一个基于Transformer编码器的运动信息交互模块,精确地捕捉不同关节点之间的动态运动关系。相较于已有直接对人体关节点的整体运动进行学习的模型,此方法能够使得预测精度提高约3%。与注重单节点运动的最先进MixSTE模型相比,该模型在捕捉关节点的时空特征方面更为高效,推理速度实现了20%以上提升,使其更适合于实时推理的场景。

数据和表 | 参考文献 | 相关文章 | 计量指标
虚拟现实环境下的协同式三维建模方法
王浩淼, 桑胜举, 段晓东, 张伟华, 陶体伟, 马婷
2024, 45(1): 169-182.  DOI: 10.11996/JG.j.2095-302X.2024010169
HTML    PDF 16     30

三维建模技术在各个领域发挥着重要作用,但以桌面交互为主的三维建模方式仍复杂、抽象且不支持在线协作。为此,借助虚拟现实(VR)技术的沉浸性、交互性、想象性等优点,提出一种VR环境下的网络协同三维建模方法,使得用户以沉浸式的交互方式建立三维模型,并支持多人实时在线可视化协作。首先,提出了一种VR环境下的三维模型绘制交互方式;其次,将三维模型进行分类,提出一种分层构建式的三维模型网格生成算法,用于建立平面模型和立体模型;最后,设计了一种VR环境下的三维建模网络协同模块,并基于Socket通信实现了网络同步。通过与传统三维建模软件的三维建模方法进行对比实验表明,该方法更加简捷、直观和高效,且易于普通用户掌握。

数据和表 | 参考文献 | 相关文章 | 计量指标
利用最小二乘法的网壳结构点云节点中心坐标提取
王鹏, 辛佩康, 刘寅, 余芳强
2024, 45(1): 183-190.  DOI: 10.11996/JG.j.2095-302X.2024010183
HTML    PDF 10     12

为解决网壳结构节点坐标测量困难、处理效率低等问题,本文提出基于网壳结构扫描点云的节点中心坐标提取方法:应用三维激光扫描技术采集网壳结构点云数据并预处理;然后基于设计模型,对初始点云模型进行网壳节点局部点云分割和节点多平面拟合,判定拟合平面的属性特征并修正侧面的法向量方向;最后利用空间约束关系及最小二乘算法求取网壳结构节点的精确中心坐标。以三亚国际免税城项目为例开展应用,结果表明所提方法求取的网壳结构节点中心坐标与全站仪实测结果偏差均值为2.89 mm,效率相比传统方法提高近4倍,较大提升了网壳结构节点中心坐标的提取精度和效率,为后续网壳结构施工偏差复核、幕墙板材的深化设计与加工等工程化应用提供了准确的数据支撑。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于关联事件场的智能化仿真社会实验方法
陈玉珑, 张志忠, 马利庄, 叶淑兰, 陈敏刚
2024, 45(1): 191-198.  DOI: 10.11996/JG.j.2095-302X.2024010191
HTML    PDF 8     15

智能化进程正在迅速推动数字中国建设,不断改变相关社会和人文形态,同时引发了人工智能涉及的社会衍生风险等关键问题。在遵循社会伦理和隐私保护前提下,前瞻性探索新型人工智能社会实验模式,规范人工智能技术的发展,具有重要的现实意义。探讨了在特定社会实验环境下的事件场构建方式方法,以及人物、行为和场景三者的关联关系,基于数据和实验的社会化传导模式以及社会衍生效应进行预测。尝试通过前瞻性的虚拟仿真博弈实验,验证智能化仿真社会实验模式的有效性,为政府提供前瞻性的决策工具和智慧管理建议。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于混合结构的多视图三维场景重建
周婧怡, 张栖桐, 冯结青
2024, 45(1): 199-208.  DOI: 10.11996/JG.j.2095-302X.2024010199
HTML    PDF 11     18

基于PatchMatch的多视图高效和高精度三维重建一直是一个挑战性问题。红黑棋盘格模式的传播方式并行计算效率高,但对应的视图选择策略精度较差;基于马尔可夫链的视图选择策略能获取更为准确的匹配结果,但算法并行度较低。为了达成场景重建质量与重建时间的平衡,本文提出了一种基于混合结构的多视图三维重建算法,在第一阶段采用沿行/列并行的传播策略和马尔可夫链式的视图选择策略,得到质量较高的初始深度图,并通过引入多层次处理提升弱纹理区域的重建质量;在第二阶段采用棋盘格式传播方式和基于投票的视图选择策略提高计算效率,缩短重建所需时间。通过在Strecha和ETH3D数据集上进行了大量实验和对比表明,本文算法在不降低计算精度的前提下,计算效率提高2.5倍以上。

数据和表 | 参考文献 | 相关文章 | 计量指标
TCPVis:基于谢赫六法的传统中国绘画画派可视分析系统
王斯加, 封颖超杰, 朱航, 张玮, 朱琳, 陈为
2024, 45(1): 209-218.  DOI: 10.11996/JG.j.2095-302X.2024010209
HTML    PDF 42     65

传统中国绘画(国画)在历史的发展中形成了多种多样的画派体系。对画派的分析有助于人们更好地理解与赏析国画的价值。然而,现有工具无法直观高效地表现画作集合的绘画风格等一系列代表性特征。基于“谢赫六法”,提出了一个国画画派可视分析系统TCPVis,以支持用户分析国画画派的笔法、物象、赋彩等多维度特征。系统能够自动分析画派作品在六法维度上的特征共性,并推荐维度的权重。同时,它可视化了六法维度的标签分布以支持用户验证。基于六法维度权重,系统对画作集合进行降维聚类展示,帮助用户探索更多风格相似的画作,并支持画作的画家关联性分析。通过两个案例研究和领域专家访谈,证明了该系统对于分析画派特征与探索画派更多画家的有效性与可用性。

数据和表 | 参考文献 | 相关文章 | 计量指标
DGOA:基于动态图和偏移注意力的点云上采样
韩亚振, 尹梦晓, 马伟钊, 杨诗耕, 胡锦飞, 朱丛洋
2024, 45(1): 219-229.  DOI: 10.11996/JG.j.2095-302X.2024010219
HTML    PDF 15     13

由三维扫描设备直接得到的点云经常是稀疏、不均匀、有噪声的,因而点云上采样在点云重建、渲染等领域扮演了越来越关键的角色。为此提出了一种新的基于动态图和偏移注意力的点云上采样网络DGOA,主要包含局部特征提取(LFE)、全局特征提取(GFE)和坐标重建(CR) 3个模块。LFE采用多层结构提取邻域信息,每层基于特征相似性构建动态图,可以在特征空间自适应的将点云分组,增大感受野,获得长距离的语义信息,更好的建模点云的局部几何形状。GFE采用基于拉普拉斯算子的偏移注意力使每个点都能获得点云的全局信息,使生成点云的细节与原始点云一致,减少噪声的影响。CR借鉴FoldingNet操作,避免生成点的聚集。此外,整个网络与输入点云中点的顺序无关,具有置换不变性。在多个数据集的定量与定性实验结果表明,该方法优于其他方法,并且具有良好的泛化性和稳定性。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于自适应聚合循环递归的稠密点云重建网络
王江安, 黄乐, 庞大为, 秦林珍, 梁温茜
2024, 45(1): 230-239.  DOI: 10.11996/JG.j.2095-302X.2024010230
HTML    PDF 11     14

为了解决弱纹理重建难、资源消耗大和重建时间长等问题,提出了一种基于自适应聚合循环递归卷积的多阶段稠密点云重建网络, 即A2R2-MVSNet(adaptive aggregation recurrent recursive multi view stereo net)。该方法首先引入一种基于多尺度循环递归残差的特征提取模块,聚合上下文语义信息,以解决弱纹理或无纹理区域特征提取难的问题。在代价体正则化部分,提出一种残差正则化模块,该模块在略微增加内存消耗的前提下,提高了3D CNN提取和聚合上下文语意的能力。实验结果表明,提出的方法在 DTU数据集上的综合指标排名靠前,在重建细节上有着更好的体现,且在BlendedMVS数据集上生成了不错的深度图和点云结果,此外网络还在自采集的大规模高分辨率数据集上进行了泛化测试。归功于由粗到细的多阶段思想和我们提出的模块,网络在生成高准确性和完整性深度图的同时,还能进行高分辨率重建以适用于实际问题。

数据和表 | 参考文献 | 相关文章 | 计量指标
本期样刊
2024年第1期样刊
2024, 45(1): 240. 
PDF 21     52
相关文章 | 计量指标