欢迎访问《图学学报》 分享到:
双月刊,创刊于1980年
主管单位:中国科学技术协会
主办单位:中国图学学会
编辑出版:《图学学报》编辑部
主  编:汪国平
编辑部主任:侯晓红
ISSN 2095-302X
CN 10-1034/T
当期目录
2025年, 第46卷, 第2期 刊出日期:2025-04-30 上一期   
全选选: 隐藏/显示图片
封面
2025年第2期封面
2025, 46(2): 1. 
PDF 2     2
相关文章 | 计量指标
目次
2025年第2期目次
2025, 46(2): 2. 
PDF 3     3
相关文章 | 计量指标
图像处理与计算机视觉
基于自适应特征提取的通信光缆缺陷检测方法
王志东, 陈晨阳, 刘晓明
2025, 46(2): 241-248.  DOI: 10.11996/JG.j.2095-302X.2025020241
HTML    PDF 9     6

随着通信线路覆盖面积的增长,传统全介质自承式光缆(ADSS)电腐蚀缺陷巡检方式存在效率低、成本高等缺点,据此提出一种基于特征自适应提取的ADSS通信光缆电腐蚀缺陷检测方法,通过对YOLOv8n模型进行针对性改进,实现对ADSS光缆电腐蚀缺陷图像的检测。首先在主干网络中引入ADown下采样模块,在下采样过程中保留更多光缆特征的细节信息。随后引入上下文特征增强模块,使算法更有针对性地学习光缆缺陷特征。最后提出一种基于特征自适应提取的C2f_DSC模块,在颈部网络中加入,利用动态蛇形卷积特性加强对光缆区域特征的提取。在ADSS光缆电腐蚀缺陷数据集上进行实验,改进算法相比基线模型YOLOv8n在mAP50精度上提高了2.5%,在mAP50∶95精度上提高了2.2%,为ADSS光缆巡检提供了一种新的有效方法。

数据和表 | 参考文献 | 相关文章 | 计量指标
面向柴油车辆排放黑烟的改进型YOLOv8检测算法研究
张立立, 杨康, 张珂, 魏薇, 李晶, 谭洪鑫, 张翔宇
2025, 46(2): 249-258.  DOI: 10.11996/JG.j.2095-302X.2025020249
HTML    PDF 7     2

柴油车辆排放黑烟是道路交通环保执法的重点和难点。由于受复杂环境条件的影响,针对目前黑烟检测存在精度和速度方面的不足,提出一种基于改进YOLOv8的轻量级柴油车辆排放黑烟的检测模型。首先,在YOLOv8主干网络的基础上,设计一种轻量化特征提取模块C2f-FasterRep提高模型的特征提取能力,同时C2f-FasterRep模块引入上下文锚框注意力机制模块来捕捉长距离的上下文信息,利用全局平均池化和条形卷积增强特征图中心区域的特征,从而提高检测精度;其次,在颈部部分提出一个新的网络结构用于融合主干网络提取的特征,并使用通道注意力模块和维度匹配机制对不同尺度的特征进行融合,增强了模型的多尺度特征融合能力;最后,使用Transformer解码器结构优化YOLOv8模型的检测头,同时,采用交并比感知的查询机制,有助于解码器查询的优化,提高了模型的分类和定位的性能。为保证实验的真实性和有效性,利用部署在河南许昌某道路断面的检测设备采集数据并进行测试验证。实验结果表明,该方法的mAp为95.4%,精确率为94.5%,召回率为97.5%,与现有的黑烟检测方法相比,具有更高的检测精度和更快的检测速度。消融实验结果表明该轻量化特征提取模块、特征融合模块和检测头有利于提高模型检测精度。

数据和表 | 参考文献 | 相关文章 | 计量指标
DEMF-Net:基于双分支增强和多尺度融合的大规模点云语义分割
李治寰, 宁小娟, 吕志勇, 石争浩, 金海燕, 王映辉, 周文明
2025, 46(2): 259-269.  DOI: 10.11996/JG.j.2095-302X.2025020259
HTML    PDF 4     5

大规模点云语义分割是三维视觉领域的重要任务,广泛应用于自动驾驶、机器人导航、智慧城市建设和虚拟现实等领域。然而,现有方法采用下采样操作以及由于多尺度特征之间的差异过大都会降低模型对细节和局部特征的感知能力,从而大大影响语义分割的准确性。针对上述问题,提出了一种基于双分支特征增强和多尺度融合的语义分割网络DEMF-Net。设计了双分支增强聚合模块(DEA),聚焦于邻域内点云属性信息和语义特征的编码,根据双边特征生成偏移特征,将偏移特征嵌入对应原始特征,从而提高模型的局部感知能力。同时为了有效减弱不同尺度下特征间的语义鸿沟,另外设计了多尺度特征融合模块(MFF),通过融合相邻不同尺度特征,得到包含全部编码层输出的全局特征,提高模型的全局上下文感知能力并融合上层和底层编码输出,以提高特征辨识度。在SensatUrban和S3DIS场景数据集上进行大量的实验验证和分析,结果表明该方法平均交并比(mIoU)分别达到了61.6%和66.7%。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于变分自编码器掩蔽重建的骨骼点动作识别方法
王雪婷, 郭新, 汪松, 陈恩庆
2025, 46(2): 270-278.  DOI: 10.11996/JG.j.2095-302X.2025020270
HTML    PDF 2     2

掩蔽自编码器(MAE)由于其强大的自监督学习能力被用于不同领域,特别是在数据被遮蔽或可用训练数据较少的任务中获得了较好的效果。但在诸如动作识别等视觉分类任务中,由于自编码器结构中编码器学习特征的能力有限,因此分类效果欠佳。为了实现用少量标注数据对模型进行训练,并提高自编码器在骨骼点动作识别任务上的特征提取能力,提出一种基于变分自编码器(VAE)的时空掩蔽重建模型(SkeletonMVAE)用于骨骼点动作识别。该模型在传统掩蔽重建模型的编码器后引入VAE的隐空间,使得编码器学习到数据的潜在结构和更丰富的信息,并通过参数β调控重建质量,对骨骼点数据进行掩蔽重建的预训练。预训练好的编码器被用作下游分类任务的特征提取器时,其输出的特征表示更紧凑、更具判别能力和鲁棒性,从而有助于提高模型分类精度和泛化能力,提升仅有少量标注数据训练情况下的模型性能。在NTU-60和NTU-120数据集上的实验结果表明了该方法在骨骼点动作识别任务上的有效性。

数据和表 | 参考文献 | 相关文章 | 计量指标
多尺度密集交互注意力残差真实图像去噪网络
郭业才, 胡晓伟, 毛湘南
2025, 46(2): 279-287.  DOI: 10.11996/JG.j.2095-302X.2025020279
HTML    PDF 5     1

针对图像去噪特征提取不全面以及特征利用率低,导致生成图像不够清晰的问题,提出一种多尺度密集交互注意力残差去噪网络(MDIARN)。首先,通过多尺度非对称特征提取模块(MAFM)初步提取浅层信息特征,以确保图像特征的多样性;然后,多尺度级联模块(MSCM)利用多维密集交互残差单元(MDIU)对图像特征进行多维映射,并逐步级联以增强模型之间的信息传递和交互性,充分拟合训练数据;引入双路全局注意力模块(DGAM)对多级特征进行全局联合学习,获取更具有判别性的特征信息;跳跃连接促进结构之间的参数共享,使不同维度的特征充分融合,保证信息的完整性;最后,采用残差学习构建出清晰的去噪图像。结果表明,该算法在真实噪声数据集(DND和SIDD)上峰值信噪比分别为39.80 dB和39.62 dB,结构相似性分别为95.4%和95.8%,均优于主流去噪算法。此外,该算法在低光度场景下应用也能保留更多细节,从而显著提升图像质量。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于级联查询-位置关系的输电线路多金具检测方法
翟永杰, 王璐瑶, 赵晓瑜, 胡哲东, 王乾铭, 王亚茹
2025, 46(2): 288-299.  DOI: 10.11996/JG.j.2095-302X.2025020288
HTML    PDF 3     2

针对输电线路航拍图像的金具目标尺寸小与密集遮挡问题,提出了基于级联查询-位置关系的输电线路多金具检测方法(CQPR)。首先提出了级联稀疏查询模块,通过小尺度特征图上小目标的粗略位置来查询大尺度特征图中的小目标精确位置,提高小目标金具检测的准确性。接着,提出了位置特征关系模块(PRM),通过利用图像中不同金具之间的位置关系建立PRM,提取金具位置关系,丰富遮挡区域的特征,进而优化了密集遮挡下的金具检测效果。多个基线模型上的实验结果表明,将CQPR应用到基线检测框架时,Faster R-CNN,Cascade R-CNN,Libra R-CNN和Dynamic R-CNN的准确率分别达到82.9%,82.4%,83.7%和77.3%,优于其他先进目标检测模型,对其中小目标金具和存在遮挡情况的金具检测准确率的提高较为明显,推理速度也有一定的提高,同时兼顾定位精度与检测实时性。

数据和表 | 参考文献 | 相关文章 | 计量指标
MSFAFuse:基于多尺度特征信息与注意力机制的SAR和可见光图像融合模型
潘树焱, 刘立群
2025, 46(2): 300-311.  DOI: 10.11996/JG.j.2095-302X.2025020300
HTML    PDF 7     3

针对单一成像原理得到的遥感图像无法提供丰富信息的问题,异源遥感图像融合技术应运而生。合成孔径雷达图像成像不受云层、天气等因素影响,但缺乏目视观测能力;可见光图像成像易受恶劣环境影响,但拥有直视效果及目标解译能力。将二者融合可以充分利用各自优势,得到包含更多特征信息并具有目视观测能力的高质量图像。为充分利用异源图像不同尺度特征,提出一种基于多尺度特征信息与注意力机制的SAR和可见光图像融合模型(MSFAFuse)。首先,引入鲁棒特征下采样组成特征提取部分,得到异源图像对应的多尺度特征。其次,使用特征增强模块来增强不同尺度异源特征中的结构特征及显著区域特征。然后,使用基于特征信息引导以及L1-Norm的双分支融合模块将得到的异源多尺度特征按尺度进行两两融合。最后,将不同尺度的融合结果输入图像重构模块,进行图像重建,最终获得融合图像。实验表明,MSFAFuse模型可以在保留更多细节及结构信息的同时平滑地增强突出特征。与现有融合方法相比,该模型在10种不同指标上实现了较好的效果,可以有效地融合可见光图像与SAR图像,为二者融合的发展提供了新思路,有助于推动未来遥感图像融合技术的发展。

数据和表 | 参考文献 | 相关文章 | 计量指标
计算机图形学与虚拟现实
基于2D特征蒸馏的3D高斯泼溅语义分割与编辑
刘高屹, 胡瑞珍, 刘利刚
2025, 46(2): 312-321.  DOI: 10.11996/JG.j.2095-302X.2025020312
HTML    PDF 5     2

三维场景的语义理解是人类感知世界的基本方式之一。一些语义任务,如开放词汇分割和语义编辑,是计算机视觉和计算机图形学的重要研究领域。由于缺乏大型、多样化的三维开放词汇分割数据集,直接训练一个稳健、可泛化的模型并非易事。为此,提出了基于2D特征蒸馏的3D高斯泼溅,这是一种将SAM和CLIP大模型的语义嵌入蒸馏到3D高斯的方法。对于每个场景,通过SAM和CLIP获取逐像素语义特征,然后使用3D高斯可微分渲染进行训练,以获得特定场景的语义特征场。在语义分割任务中,为获得场景中每个对象的精确分割边界,设计了一种多步骤的分割掩码选择策略,无需繁琐的分层特征提取和训练过程,即可得到新视角图像精确的开放词汇语义分割。利用显式的3D高斯场景表示,有效实现了文本与三维对象间的对应,从而进行语义编辑。实验表明,该方法与所比较方法相比,在语义分割任务中获得相当或更好的定性和定量结果,同时通过三维高斯语义特征场实现了开放词汇语义编辑。

数据和表 | 参考文献 | 相关文章 | 计量指标
BPA-SAM:面向工笔画数据的SAM边界框提示增强方法
张天圣, 朱闽峰, 任怡雯, 王琛涵, 张立冬, 张玮, 陈为
2025, 46(2): 322-331.  DOI: 10.11996/JG.j.2095-302X.2025020322
HTML    PDF 2     1

由于缺乏带有像素级标注的公开工笔画数据集,使得图像分割技术在工笔画领域的发展严重受阻。工笔画具有物象与背景颜色纹理相似、使用晕染渐变导致物象边界模糊等特性,给图像分割带来了挑战,SAM的出现为解决这些挑战带来新的可能性。尽管SAM在自然图像领域里展现出惊人分割能力和零样本泛化能力,但在处理工笔画图像时存在对物象不敏感、前景背景混淆等问题。针对上述问题,首先建立了一个包含403幅图像的花鸟主题工笔画数据集SegTCRP,其中包含5类前景对象。随后,采用LoRA方法对SAM进行微调,使其适应工笔画图像的特点。此外,提出了一种新的SAM边界框提示增强方法BPA-SAM,通过借助U-Net在边界框提示范围内基于一定策略辅助生成额外点提示来改善SAM前景背景混淆的问题。最终,实验验证了BPA-SAM较原始SAM在边界框提示条件下的分割性能提升了7.1%,为SAM在工笔画领域的图像分割应用奠定了基础。

数据和表 | 参考文献 | 相关文章 | 计量指标
结合程序内容生成与扩散模型的图像到三维瓷瓶生成技术
孙禾衣, 李艺潇, 田希, 张松海
2025, 46(2): 332-344.  DOI: 10.11996/JG.j.2095-302X.2025020332
HTML    PDF 3     1

在传统手工三维内容制作中,三维网格和纹理是构建三维资产的基础。为了提升三维资产的视觉表现和渲染性能,三维网格通常采用四边面构建,并需具备良好的拓扑结构和合理的UV映射;三维纹理需要与几何形状相匹配,并保持良好的全局一致性。然而,当前基于潜在扩散模型的三维内容生成技术尚且未能满足这些标准,限制了其在实际应用中的潜力。与此同时,程序内容生成技术因其能够根据规则创建大量符合行业最佳实践的三维资产,在游戏和建筑行业中得到了广泛应用。为了提升生成资产的可用性,提出了一种结合程序内容生成与扩散模型技术的综合解决方案。以三维旋转体中具体的瓷瓶对象为例,将图像到三维资产的生成问题细分为2个主要任务:三维网格重建和三维纹理生成。在三维网格重建方面,创建了一个新颖的瓷瓶生成程序,并训练深度神经网络学习图像特征与程序参数之间的映射关系,从而实现二维图像到三维模型的重建;在三维纹理生成方面,提出了一种新颖的两段式纹理生成策略,该策略结合了多视角图像生成和多视角一致性采样技术的优势,可以生成具有全局一致性的高清纹理贴图。总结而言,提出了一种可以基于图像自动构建三维瓷瓶资产的方案,此方案可以推广到其他三维旋转体内容的生成,并有望应用于其他品类的三维内容生成。

数据和表 | 参考文献 | 相关文章 | 计量指标
虚拟现实环境下的自由雕刻系统
朱晓强, 杨伊菲
2025, 46(2): 345-357.  DOI: 10.11996/JG.j.2095-302X.2025020345
HTML    PDF 2     1

形状建模是计算机图形学中的重要领域,其中虚拟雕刻是自由形状建模中的重要范式之一。传统的虚拟雕刻通常通过控制器对模型网格进行编辑,并在显示器上观察二维的模型可视化结果,存在视角受限、沉浸感差等问题。随着近年来虚拟现实(VR)的发展,其带来的沉浸式交互体验为虚拟雕刻的发展提供了新的可能性。将VR与虚拟雕刻相结合,以准均匀网格为基础,实现了一个VR环境中的实时雕刻系统。系统设计主要包括表面点选择算法、网格优化技术、网格变形策略和拓扑融合方法,并进一步设计自由拓扑算法为雕刻建模提供更高的自由度。针对通用的雕刻过程,基于以上算法实现了一系列用户友好的雕刻工具,可保证网格始终具有封闭、流形和无自交等优点。此外,针对任意模型间无缝融合的需求,提出了2种以符号距离场引导的模型间融合方法,分别基于网格变形和网格融合。系统所创建的模型可应用于多种场景,实验结果展示了算法的有效性和通用性,以及用户友好的特性。

数据和表 | 参考文献 | 相关文章 | 计量指标
融合知识迁移的灵巧手抓取姿态生成
张旭辉, 郭宇, 黄少华, 郑冠冠, 汤鹏洲, 马旭升
2025, 46(2): 358-368.  DOI: 10.11996/JG.j.2095-302X.2025020358
HTML    PDF 6     1

五指灵巧手抓取姿态的生成在灵巧手抓取任务上具有重要意义。首先,针对不同使用意图下人手对工具的抓取姿态不同的特点,构建了基于意图的抓取姿态生成网络,强调了不同意图下抓取的功能性;其次,针对在有限的数据下训练的抓取姿态生成网络无法适应所有类内工具的问题,提出了一种融合知识迁移的抓取姿态生成方法,改进知识迁移方法以适应各种姿态的类内目标工具以生成功能性抓取,同时优化手部指间自碰撞问题;最终,在构建人手与五指灵巧手的抓取姿态映射关系时,优化基于关键点对应关系的映射规则,实现了五指灵巧手在不同意图下对类内目标工具的抓取姿态生成,为工具的后续使用操作打好基础。通过基于意图的抓取姿态生成与知识迁移相结合的方法,使得在有限数据训练得到的基于意图的抓取姿态生成网络,可以对类内目标工具生成更好的抓取姿态,相较于原网络针对实验中的类内目标工具在穿透体积上平均降低0.917 cm3,仿真位移平均降低5.25 mm,手部指间自碰撞概率平均降低49.25%。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于AR技术的文物数字化三维图像重建方法
周伟, 苍慜楠, 程浩宗
2025, 46(2): 369-381.  DOI: 10.11996/JG.j.2095-302X.2025020369
HTML    PDF 11     3

文物表面存在复杂多变的细节,要求数据采集过程需有极高的精度,以确保重建模型的原真性与准确性。然而,传统的方法难以在保持高效率的同时实现高精度,且后续的三维模型构建与纹理映射也极为复杂,需大量的手工调整。为此,提出一种基于AR技术的文物实体数字化三维图像重建方法。首先利用三维扫描与高分辨率相机,采集文物实体的点云数据和图像数据,并利用SIFT算法分别获取2类数据的特征点。依据特征点,利用Revit软件结合SketchUp和Geomagic Studio等工具,构建文物实体三维模型。通过实施虚拟相机三维注册操作,将建立的文物实体三维模型叠加在现实文物图像上,得到叠加后的虚拟文物模型。进一步,将现实文物与叠加后的虚拟文物模型实施虚拟融合,完成文物实体数字化三维图像重建。最终,结合VR技术,对重建的三维数字化图像实施交互式展示。以石峁相关文物数据集进行采集实验,结果表明,该方法能够精准重建文物的数字化三维模型。通过对比实验,该方法在三维重建精度与纹理映射上优于传统方法,减少了人工调整的工作量。有效解决传统数字三维图像重建中存在的精度不足与和操作繁琐等问题,能够高效且准确地完成文物数字化重建,为文物保护、虚拟展示及文化遗产的数字化存档提供了新的技术路径。

数据和表 | 参考文献 | 相关文章 | 计量指标
人在环路的细分行业logo生成方法
李纪远, 管哲予, 宋海川, 谭鑫, 马利庄
2025, 46(2): 382-392.  DOI: 10.11996/JG.j.2095-302X.2025020382
HTML    PDF 4     2

logo图像相比于其他生成图像类型,有着高度抽象、设计多变、风格统一的特点,因此较难直接控制生成结果。为了实现符合各行业特点、满足多种设计构成形态需要的logo高效生成,提出了一种人在环路的细分领域logo生成方法。首先,基于Dreambooth微调文生图扩散模型,以网络公开资源搜集的logo作为数据集,将文生图模型Stable Diffusion XL作为基座模型训练出适用于基础logo生成的“雏形模型”。然后,构造出多组适用于各目标行业领域的文本提示词库,在提示词库指导下,通过雏形模型对各目标行业的logo进行生成。接着,通过人工介入对生成结果进行筛选,推演构造出符合行业需求的二次数据集。最后,利用得到二次数据集对模型基于LoRA进行迭代微调,得到生成logo的“成品模型”,并通过生成图像与提示词的余弦相似度以及人工问卷指标对成品模型的生成结果进行评估,验证了成品模型生成的logo图像在行业关联度、结构完整性以及美观程度等评价维度上相比于未经过上述处理的原模型直接生成的效果有可观提升。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于半监督学习的单视角点云三维人体姿态与形状估计
方程浩, 王康侃
2025, 46(2): 393-401.  DOI: 10.11996/JG.j.2095-302X.2025020393
HTML    PDF 7     2

在有限标签样本的条件下,单视角点云的三维人体姿态和形状估计一直存在模型估计精度低、泛化能力弱等问题。现有的方法通常采用微调方法优化模型,但对新样本的微调步骤大大增加了运行复杂度,本质上没有提高模型的泛化能力。为解决以上问题,提出了一种基于半监督学习的三维人体姿态与形状估计方法,在有限的标签数据条件下,利用大量无标签人体点云数据提高模型估计精度和泛化能力。具体地,首先对无标签数据进行弱增强和强增强,同时估计2种增强样本的三维人体参数模型。然后对弱增强样本的预测结果进行伪标签准确性判断,并基于一致性正则化思想约束强增强样本的预测结果,以迭代方式逐步优化伪标签质量和增加用于训练的伪标签数量,进而提升模型的估计精度。该算法在多种公开数据集上做了充分的定量和定性实验,实验结果证明该算法在有限标签样本的条件下提高了三维人体姿态和形状的估计精度,并增强了模型的泛化性能。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于用户样例的图布局定制化调整
陈俊旭, 吴子梁, 朱闽峰, 陈为
2025, 46(2): 402-414.  DOI: 10.11996/JG.j.2095-302X.2025020402
HTML    PDF 3     1

传统的自动图布局算法虽然能保证图布局的整体美学特性,但却无法生成定制化的图布局。在不同的实际应用场景下,用户常常需要对自动布局后的图进行调整以满足具体的需求。现有的图布局调整主要分为2类:节点级别的手动调整和基于约束的图布局,前者非常耗时且枯燥,后者常常缺乏灵活性。为此,提出了一种基于用户样例的图布局定制化调整方法,主要基于图混合理论将样例图的属性和特点混合到源图上,从而实现灵活、高效的图布局定制化调整。首先对样例进行预处理,然后设计2种映射样例和6种映射模式来生成样例和源图之间节点级的映射矩阵,并使用该映射矩阵将样例图向源图对齐,最后按照一定比例进行混合得到定制化调整的图布局。设计开发了一个基于web的交互系统来实现该方法,系统支持样例草图绘制、样例导入和选取、源图导入和选取、映射模式选择、图混合比例控制、节点级的微调。同时开展了案例分析和评估实验,结果验证了该方法的可行性和有效性。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于改进神经辐射场的民族舞蹈重建方法
邱佳新, 宋倩云, 徐丹
2025, 46(2): 415-424.  DOI: 10.11996/JG.j.2095-302X.2025020415
HTML    PDF 2     1

中国民族舞蹈作为一种世代传承的艺术形式,诞生于人民群众的日常生活之中,但是随着社会发展,一些传统的舞蹈存在传承不到位的问题,继而面临着濒临失传的尴尬局面。不同民族的舞蹈各具特色,动作变化复杂,为了更好地对民族舞蹈进行保护,于是提出一种基于改进神经辐射场的民族舞蹈三维重建方法。首先通过一个改进的姿态估计算法,在对姿态进行降噪优化后将形变场分解为由深度神经网络产生的刚性运动以及非刚性运动,并通过线性混合蒙皮将姿态由观测空间映射到标准空间,以此得到一个与姿态无关的形变场。然后,使用神经辐射场来对人体进行三维重建,在重建的过程中使用注意力机制加强边缘色彩的学习,同时对姿态估计得到的人体动作进行优化,最后得到舞蹈者每一帧不同视角的新渲染视图。实验结果表明,该方法能较好地对舞蹈者及舞姿进行三维重建,与HumanNeRF相比,提高了还原的精度。相比传统的、二维的舞蹈保护技术,此方法能更好地还原出舞蹈者的动作,以达到对民族舞蹈保护的目的。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于平面路径的扫掠面高精度重建
刘圣军, 陶珊珊, 王海波, 李钦松, 刘新儒
2025, 46(2): 425-436.  DOI: 10.11996/JG.j.2095-302X.2025020425
HTML    PDF 5     1

从三角网格数据重建CAD建模过程是逆向工程中的研究重点之一,高效、高精的曲面重建具有重要的工程价值。针对由直线段和圆弧段组成的平面路径扫掠生成的三角网格表示曲面,提出了基于轮廓和路径曲线自动提取的扫掠过程重建,实现扫掠曲面的高精度重建。首先,基于统一三角网格模型曲率矢量场自动获得初始路径,再利用高斯映射迭代和配准拟合的方法生成了扫掠的轮廓曲线;然后,逆向计算扫掠路径的离散有序点集,通过引入切空间表示方法来识别路径中的直线段和圆弧段,并基于相切几何约束条件建立了拟合的优化模型,对初始路径进一步优化;最后,由计算得到的轮廓曲线和路径曲线执行扫掠操作,以获得重建的扫掠曲面。实验结果表明,该方法实现了自动提取轮廓曲线和路径曲线,进而重建扫掠模型的建模过程,减少了繁琐的人工交互,提取的轮廓和路径有效地避免了离散误差累积,使得最终重建的扫掠曲面精度更高,且适用于有噪声的数据和存在缺失数据的扫掠曲面。

数据和表 | 参考文献 | 相关文章 | 计量指标
离散测地距离场的高精度等值线提取
王文嵩, 周子珺, 辛士庆, 屠长河, 王文平
2025, 46(2): 437-448.  DOI: 10.11996/JG.j.2095-302X.2025020437
HTML    PDF 2     2

测地等值线在可视化几何形状的内在度量变化方面以及验证给定测地算法的准确性上,具有重要的意义。通常,在线性三角网格上绘制测地等值线的具体做法是通过在三角形的内部根据顶点的距离值进行简单的线性插值。该方法因易于实现而被广泛应用,但由于测地距离场具有高度的非线性特征,其精度受到限制。因此,使用线性插值得到的等值线常常会出现各种失真现象,尽管可对输入网格进行极高分辨率的细分,依然难以捕捉到真实等值线的拓扑特征,如捕获尖锐的拐角部分很困难。考虑到脊线能够有效地表征测地路径的不连续过渡,提出了一种新的思路:类似于中轴面可以通过密集边界采样点的维诺图进行编码,测地等值线的几何和拓扑特征同样可以借助阿波罗尼乌斯图进行编码。具体而言,采用三次函数来逼近每条网格边上的距离函数变化,并依据分布在网格边的一组加权采样点生成阿波罗尼乌斯图。随后,将每个三角形根据生成的阿波罗尼乌斯图划分为若干个子区域,使得每个子区域内的距离场可以用线性函数进行有效近似。通过大量实验,验证了该方法的有效性,结果显示在较少的额外计算成本下,所生成的测地等值线相较于传统的线性插值方法,具有更高的准确性。

数据和表 | 参考文献 | 相关文章 | 计量指标
数字化设计与制造
数字孪生驱动的卫星太阳翼展开测试仿真与预测方法
陈瑞启, 刘晓飞, 万峰, 侯鹏, 沈金屹
2025, 46(2): 449-458.  DOI: 10.11996/JG.j.2095-302X.2025020449
HTML    PDF 3     1

卫星太阳翼在线展开成功与否是影响其服役性能的关键影响因素,而卫星太阳翼地面展开测试是验证机构展开锁定性能和展开指标符合性的关键研制步骤。为解决卫星太阳翼地面展开测试过程数据监控少、仿真精度低、结果难预测的难题,提出了一种数字孪生驱动的卫星太阳翼地面展开测试仿真与预测方法和体系架构。在典型卫星太阳翼产品、展开地面测试相关工装设备和展开测试单元数字孪生建模的基础上,开展面向卫星太阳翼地面展开测试的多学科联合仿真并输出仿真数据库,结合仿真数据和历史测试数据构建预测模型训练数据集,在此基础上完成卫星太阳翼展开过程预测模型的训练与优化。通过物联网平台实时采集地面展开测试过程关键参数,输入优化后的关键参数预测模型中,实现卫星太阳翼地面展开测试过程中位姿、受力、速度和展开时间等关键参数的快速、准确预测。最终以孪生模型为基础,融合实采、预测数据,实现机构展开过程实时监控和预测结果可视化,支持卫星太阳翼地面展开测试过程智能管控和决策,指导展开工艺优化和现场调整,有效提高展开成功率和效率。通过在卫星展开单元的部署并在典型卫星型号上开展应用验证,典型太阳翼展开时间、位姿等关键参数在线预测准确率大于90%,验证了该方法的有效性和可行性。

数据和表 | 参考文献 | 相关文章 | 计量指标
工业设计
汽车自动驾驶接管系统人机界面用户体验评价研究
吴磊, 盛芹芹, 赵睿思
2025, 46(2): 459-468.  DOI: 10.11996/JG.j.2095-302X.2025020459
HTML    PDF 6     1

为解决汽车自动驾驶接管系统人机界面用户体验评价问题,针对自动驾驶接管系统人机界面开展评价指标体系和验证研究。首先,基于深度访谈和扎根理论,通过对典型目标对象进行访谈,建立自动驾驶接管系统人机界面体验评价指标体系,包括安全体验、功能体验、效能体验和感性体验4个维度,共18项指标组成,并完成自动驾驶接管系统人机界面体验评价量表。然后,采用结构方程模型方法,通过采集有效问卷241份,构建自动驾驶接管系统人机界面体验评价结构方程模型,并得到评价维度和指标的权重。最后,提出汽车自动驾驶接管系统人机界面的设计策略,以某L3级自动驾驶接管系统人机界面为设计案例实践,验证了评价系统的有效性。研究结论为汽车自动驾驶系统界面设计和体验评价领域提供相关参考和支持。

数据和表 | 参考文献 | 相关文章 | 计量指标
认知机制视域下的机器人手术系统界面设计迭代优化
李赛赛, 孙博文, 李迪嘉, 潘文娟
2025, 46(2): 469-478.  DOI: 10.11996/JG.j.2095-302X.2025020469
HTML    PDF 4     5

为提升医生使用手术机器人辅助诊疗过程中的认知体验,完成机器人手术系统交互界面设计迭代优化,确保系统救治的高效性与安全性而进行系统研究分析。首先,选取肝癌消融手术机器人交互界面为研究对象,基于BERT模型形成的自然语言处理技术(NLP),完成用户口语报告关键词提取与认知关联词汇筛选与分类,并通过亲和图法归纳和完善用户需求描述;在ICE三维评分模型基础上创新性融合理想点矢量投影法获取专家对各需求项的权重赋值,并参考开发成本筛选出关键需求;结合认知机制原理与FAST模型进行需求分析,完成需求层到设计层映射转化,并对迭代前后方案分别进行可用性测试,收集主、客观评价数据验证设计合理性。然后,以认知特性为切入点,综合运用定性与定量分析完成肝癌消融手术机器人界面设计迭代与优化。最后,通过可用性测试得出迭代后方案能够显著降低任务操作时长与无效操作频次,同时获取用户更高的体验评分。在机器人手术系统界面设计领域引入认知理论作为指导,综合运用BERT自然语言处理模型以及ICE-理想点矢量投影相结合的需求分析法进行设计分析,并以此为基础形成的设计方案能够提升原有界面可用性,优化操作过程认知体验,在理论和实践层面为机器人手术系统界面设计提供指引与参考。

数据和表 | 参考文献 | 相关文章 | 计量指标