图学学报

Select

2026年第2期封面

2026, 47(2): 0-0.

PDF 31 36

相关文章 | 计量指标

Select

基于生成模型的图像数据增强方法综述

向婷, 唐卓, 郑佳丽, 陈长建, 吕斐, 李肯立

2026, 47(2): 235-250. DOI: 10.11996/JG.j.2095-302X.2026020235

HTML

PDF 97 63

深度学习在计算机视觉领域展现出巨大的潜力，但其在实际应用中的表现依赖于大量高质量的标注数据。生成模型因其具有生成多样化数据的能力，成为解决数据稀缺问题的有效方法，旨在高效率且有效地为计算机视觉提供训练数据。进而，基于生成模型的图像数据增强技术成为近年来的热点方向。为此，对基于生成模型的图像数据增强方法进行了全面的文献调研，通过三阶段检索方法得到相关的37篇文献，将其方法过程总结归纳为4个步骤，并对每一个步骤采用的方法进行分类与详细描述。首先，从生成模型的选择出发，介绍可用于图像数据增强的各类生成模型；然后，对生成式图像数据增强方法进行分类，并详细介绍每个类别的方法流程和代表性论文，以及存在的问题和亟需优化的方向；考虑到生成数据存在噪声的问题，还介绍了对生成数据的选择和处理方法，以更好地在下游任务中利用生成数据；接着，对数据增强效果验证方法进行分类与描述，以全面验证方法的有效性和鲁棒性。最后，详细阐述了生成式图像数据增强在生成图像的语义一致性、多样性、生成效率和对黑盒模型的应用等方向面临的机遇与挑战，并指出未来潜在的探索方向。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

基于CiteSpace的国内外手术机器人交互设计分析比较研究

王一芮, 华馨怡, 汤天宇, 王奕霖, 闫祉祺, 耿子涵, 陈星宇, 杨建明, 孙博文

2026, 47(2): 251-263. DOI: 10.11996/JG.j.2095-302X.2026020251

HTML

PDF 45 22

针对手术机器人在人机交互设计领域的发展现状，开展了系统的比较与可视化研究。基于Web of Science和CNKI数据库，检索手术机器人交互设计相关文献，运用文献计量分析法与内容分析法，结合VOSviewer和CiteSpace的可视化功能，绘制知识图谱，从合作网络分布、研究热点主题和时区演化3个维度揭示手术机器人交互设计领域的研究格局与发展趋势。结果表明，国外手术机器人交互设计研究起步较早，各研究机构之间联系紧密，研究内容精细化，更关注技术驱动研发；相比之下，国内该领域研究起步较晚，研究机构之间互动相对较少，且研究内容较分散，侧重于理论研究和用户体验。研究指出，未来应强化跨学科协同创新，融合智能语音识别、高精度视觉与触觉数字化、运动轨迹智能规划、机器学习与大数据建模等前沿技术，以推动手术机器人交互设计的智能化、精确化与人性化发展。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

面向景区直播流推荐的视频吸引力评价方法

周强, 黄尧秋, 史伟民, 周忠

2026, 47(2): 264-274. DOI: 10.11996/JG.j.2095-302X.2026020264

HTML

PDF 50 12

随着5G、云计算与音视频等技术的普及，视频流直播成为线上文旅的重要形态。但主流的多摄像机“慢直播”缺乏人工导播与脚本，内容随机性强，使传统基于偏好与热度的推荐方法难以奏效。为此，提出了一种视频吸引力评价方法，通过评估多视频源内容对观众注意力和情感共鸣的激发能力，从而预测其对观众的吸引效果。相较于传统基于偏好与热度的推荐方法，视频吸引力评价方法更适用于景区直播场景。围绕“视频吸引力”这一概念，首先构建多角度线索引导的视频描述生成方法，引入大型视觉语言模型(LVLM)对视频进行关键信息抽取、结构化内容表征与情感语义推理，并整合为可读的描述文本与吸引力因素；其次建立基于多模态特征的视频吸引力评价方法，在对比学习网络中引入交叉注意力、动态显著性与负样本增强，输出吸引力评分与关键因素；最后在此基础上实现了视频吸引力驱动的景区直播系统原型，包括频道推荐、吸引力可视化与AI导览等功能。在TVSum50数据集上，验证了视频描述与视频内容的相关性，较原始视频描述提升了7.00%，在跨任务泛化实验中提升了6.00%；在自建景区直播数据集上，基于多模态特征的视频吸引力方法相较基线在吸引力评价上提升了24.00%。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

基于颜色多粒度学习的文本-图像行人再识别

周腾龙, 杨文杰, 阴绍桦, 于元隆

2026, 47(2): 275-285. DOI: 10.11996/JG.j.2095-302X.2026020275

HTML

PDF 57 36

文本-图像行人再识别旨在使用自然语言描述从图像数据库中检索目标行人，该任务在视频监控和公共安全领域具有重要的应用价值。尽管现有的文本-图像行人再识别方法在跨模态细粒度对齐方面已取得显著进展，但其对颜色这一关键判别线索的探索尚不充分，未能有效弥合文本颜色描述的离散性与图像颜色表示的连续性之间存在的显著语义鸿沟。由于模态差异不仅易误导模型的特征学习，也限制了最终的检索精度。针对上述问题，提出了一种基于颜色多粒度学习的文本-图像行人再识别方法(MGCL)。采用双塔视觉语言模型架构作为特征提取网络，从全局、短语和单词3个粒度对颜色信息进行建模，旨在由粗到精地捕捉和对齐颜色信息，从而全面提升模型的颜色感知能力与跨模态对齐精度。在全局粒度，引入颜色一致性建模，通过一个带有交叉注意力机制的解码器，融合灰度图像嵌入与图文联合嵌入，以重建彩色图像的视觉表示。并引导模型学习文本概念到连续视觉颜色空间的隐式映射，从而缓解跨模态颜色表达的语义差异；在短语粒度，设计颜色短语多标签分类任务，将重建彩色图像的视觉表示与预先构建的颜色短语特征库投射到共享语义空间中进行对齐，强化模型对“颜色-物体”的精确理解；在单词粒度，提出颜色感知替换检测机制，通过对文本中的颜色词进行掩码并重建判断颜色词是否被替换，增强模型对颜色词的敏感性。实验结果表明，MGCL通过颜色多粒度学习实现了更精确的跨模态细粒度对齐，在3个公开数据集CUHK-PEDES，ICFG-PEDES和RSTPReid上均取得了优越性能，验证了该方法在文本-图像行人再识别任务中的有效性。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

基于图拓扑特征提取的跨模态一致性检测方法

房友江, 王世豪, 张亮, 段可然, 刘越, 魏小鹏, 杨鑫

2026, 47(2): 286-295. DOI: 10.11996/JG.j.2095-302X.2026020286

HTML

PDF 43 20

随着社交媒体的迅猛发展，海量多模态信息在网络舆情事件中广泛传播，自动化舆情监测技术成为社会治理与风险预警的重要手段。讽刺、隐喻等复杂表达在舆情信息中频繁出现，其本质常体现为文本与视觉信息间的不一致性，极大增加了自动识别的难度。现有跨模态一致性检测方法在对单模态与跨模态信息的结构化建模、深层语义理解等方面仍存在不足，影响了对真实舆情态势的精准把控。针对上述问题，提出一种图结构感知跨模态舆情网络(GCPNet)。首先，利用CLIP模型作为特征编码器，并以文本单词和图像块为节点构建全连接图拓扑结构，通过图卷积网络(GCNs)显式挖掘并增强多模态信息内部的语义与结构关联。其次，设计分层交互式注意力图模块，通过细粒度交叉注意力对齐、全局自适应门控融合以及动态图结构增强3个阶段，提升对复杂上下文的全局建模与深层交互能力。最后，采用自适应加权融合策略，动态整合单模态结构化特征与跨模态交互特征。在公开基准数据集MMSD2.0上的实验结果表明，GCPNet能够精准捕捉跨模态一致性线索，有效识别讽刺、隐喻等复杂舆情内容，在准确性和鲁棒性方面均优于现有主流方法。该研究为多模态舆情监测(MPOM)任务提供了新的技术路径和理论支撑，也为实际舆情治理和社会安全保障提供了有力工具。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

面向积水干扰的变电设备渗漏油精准分割方法

赵振兵, 张靖梁, 唐辰康, 毕雨轩, 李浩鹏

2026, 47(2): 296-310. DOI: 10.11996/JG.j.2095-302X.2026020296

HTML

PDF 47 23

变电设备渗漏油的准确分割对于保障电力系统安全运行至关重要。然而，渗漏油与积水的高度视觉相似性、自身形态的不规则性以及此类干扰场景下训练数据的匮乏，对现有分割方法构成了严峻挑战。针对上述问题，提出了一种从数据增强到网络模型优化的综合解决方案。首先，设计了一种新颖的基于扩散模型的时间步自适应调谐方法(EvoTune)，通过动态调整U-Net在图像生成过程中的特征贡献，有效扩充了数据集中积水干扰场景的样本数量与多样性。其次，在数据增强的基础上，提出了一种高性能的渗漏油分割网络HyDR-Net。该网络通过判别式边界抗扰模块(DBAIM)，增强渗漏油与积水等易混淆背景的特征判别能力，并有效抑制背景噪声；以及多尺度注意力校准模块(MAAM)，对渗漏油特征进行多尺度上下文感知和精细化的边界校准，以适应渗漏油不规则的形态。实验结果表明，EvoTune在SSIM，PSNR和NIQE指标上分别达到0.918 8，26.790 2 dB和5.713 3，显著提升了训练数据的质量和积水区域的生成真实感；而HyDR-Net在F1和PA指标上分别达到80.46%和92.15%，在各项关键评价指标上均大幅超越了现有主流分割方法，尤其在复杂积水干扰场景下展现出卓越的分割精度与鲁棒性。为解决特定视觉干扰下的数据稀缺问题提供了有效途径，并为变电设备渗漏油的智能、精准检测提供了强有力的技术支撑。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

基于超图Transformer的多尺度时序增强动作识别方法

陈庆拴, 陈恩庆, 郭新, 汪松

2026, 47(2): 311-321. DOI: 10.11996/JG.j.2095-302X.2026020311

HTML

PDF 52 16

基于骨骼的人体动作识别因其对背景干扰的鲁棒性和结构化表示而受到广泛关注。近年来，Transformer架构因其强大的建模能力被广泛应用于该任务。然而，现有方法在识别包含局部细节变化、复杂时间动态或强时序依赖的动作时仍面临挑战，主要归因于其局部空间语义建模不足、多尺度动态感知能力有限以及缺乏显式的时间位置感知。此外，传统Transformer方法采用传统时间卷积降维易导致重要动态信息丢失。为克服上述问题，提出一种基于超图Transformer的多尺度时序增强模型。首先，设计了一个局部多尺度增强模块(LME)，且通过矩形上下文建模机制增强对四肢等关键区域的局部特征感知，并利用高效多尺度注意力机制融合不同时间粒度的动作模式，从而提升模型对多节奏动作的适应性。同时，在空间注意力模块中引入可学习的时间位置编码(TPE)，为空间依赖建模注入时序先验，以更准确地捕捉时空耦合关系。进一步地，采用基于Haar小波变换与通道注意力机制的时间压缩模块(SEDS)替代传统时间卷积降维，在降低计算量的同时保留关键动态信息。在NTU RGB+D 60，NTU RGB+D 120和Northwestern-UCLA3个公开数据集上的实验结果表明，该模型在识别准确率上优于多种主流方法，尤其在复杂背景、细节动作及大规模数据场景下展现出更强的鲁棒性与准确性。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

基于大模型的皮肤病图像掩膜生成与分割

陈梦琪, 赵俊莉, 邓晓丹

2026, 47(2): 322-331. DOI: 10.11996/JG.j.2095-302X.2026020322

HTML

PDF 50 21

作为恶性肿瘤中发病率较高的病种，皮肤癌的及时检出具有重要临床意义，其中皮肤病灶的准确识别与分割是计算机辅助诊断的重要前提。尽管深度学习技术在医学图像分割领域展现出了卓越性能，但现有模型普遍面临着病灶边缘分割精度不足、训练数据规模与多样性受限等问题。为解决上述问题，提出了一种名为BESA-Diff边界增强模型系统，采用边界增强扩散模型DermoSegDiff作为核心分割架构，通过模型优化训练流程。其核心技术贡献体现在：①基于扩散模型构建了皮肤病理性图像及掩膜自动生成框架；②设计了一个创新的掩膜精细化流程：创新性地整合了分割任意模型(SAM)与DermosegDiff的边缘细化模块，构建了高质量的合成医学影像数据集。通过在ISIC2018标准数据集、PH2数据集、HAM10000数据集与合成数据集上的实验结果表明，本模型在戴斯相似系数(Dice)和交并比(IoU)等关键分割指标上均显著优于基线模型。消融实验证实，引入SAM进行掩膜精细化是性能提升的关键，该模块有效改善了病灶边缘的分割效果，特别是在边界模糊或对比度低的区域。研究证实，融合扩散模型的数据生成能力与通用分割模型的边界优化能力，能够有效地提升皮肤病灶分割的精确性与鲁棒性，为皮肤癌辅助诊断提供了一种高性能的解决方案，展现了合成数据技术在突破医学人工智能数据瓶颈方面的巨大潜力。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

融合语义特征的全景图像质量评估

包永堂, 王谟钦, 王智慧, 马光晓

2026, 47(2): 332-340. DOI: 10.11996/JG.j.2095-302X.2026020332

HTML

PDF 31 12

全景图像质量评估旨在客观反映沉浸式视觉内容的主观感知质量。然而，现有深度学习模型在该任务中，常因过度依赖底层失真特征而导致其客观预测与人类主观感知存在显著偏差。为解决这一关键问题，提出一种新颖的层级式语义引导网络，其核心在于模拟人类视觉系统中“自顶向下”的认知机制。当前主流方法多遵循“自底向上”的范式，即从像素级特征中聚合质量分数，由于过程缺乏对图像全局结构、构图美学等高级语义信息的有效整合，从而限制了其性能上界。为此，该框架构建了一个双路并行信息处理体系，其核心在于“自顶向下”的语义注意力调制机制。在该体系中，语义先验通路利用视觉语言模型将输入图像解析为一个结构化的语义嵌入向量；与此同时，视觉表征通路通过深度卷积网络提取多尺度特征图。其设计的调制机制以语义嵌入向量为条件输入，生成动态注意力权重，对视觉通路中的多尺度特征进行实时重标定。并使得整个特征提取过程都能受到高级语义的引导，从而聚焦于人类主观判断的关键信息。为确保模型预测在排序关系上与人类感知保持一致，整个框架通过一个结合了列表排序损失的复合目标函数进行端到端优化。在CVIQD，OIQA和OIQ-10K的3个公开基准数据集上的综合实验结果表明，该框架的性能显著优于现有前沿方法，验证了该语义引导范式在提升感知质量评估任务上的有效性与先进性。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

基于跨域结构化深度字典学习的图像分类方法

闫康, 曾理, 顾晓清

2026, 47(2): 341-350. DOI: 10.11996/JG.j.2095-302X.2026020341

HTML

PDF 35 8

图像分类在计算机视觉领域中具有重要意义，然而传统基于深度学习的图像分类方法通常依赖大规模标注数据，这在许多小规模图像数据集中难以实现，尤其是在目标领域标注数据稀缺的情况下。为应对这一挑战，提出一种基于跨域结构化深度字典学习(CD-SDDL)的图像分类方法。该方法通过分别在源域与目标域建立多层字典，通过跨域字典正则化实现结构层面的软对齐，从而减少域偏差；引入类内紧致性、类间分散性以及拉普拉斯局部结构保持约束，以增强特征的几何一致性与区分能力；同时采用逐层展开的深度字典框架，将结构化约束与非线性映射相结合，以捕获更复杂的跨域特征模式。实验结果表明，与现有方法相比，CD-SDDL在处理跨域任务时，展现出更高的泛化能力，能够有效提高分类性能。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

基于三维流形拟合与分频引导注意力机制的多聚焦图像融合

张宙, 王泽宇, 宋海玉, 李威, 葛鸣宇, 王嘉宇, 王文琦

2026, 47(2): 351-359. DOI: 10.11996/JG.j.2095-302X.2026020351

HTML

PDF 31 9

多聚焦图像融合是一种将同一场景下不同聚焦区域的多幅图像整合，以生成一幅同时具备清晰细节与完整结构信息的全聚焦清晰图像的技术，在消费电子、医学成像和卫星遥感等领域应用广泛。针对基于深度学习的图像融合普遍存在信息丢失、伪影、数据集匮乏以及时空开销大等问题，提出了基于三维流形拟合与分频引导注意力机制的融合模型。该模型采用特征分解-融合-重构的新范式，通过在编码阶段有效识别并分离背景结构与细节信息，从而有效减少结构信息损耗与伪影引入；创新性地利用三维流形拟合实现多聚焦图像共性特征提取，降低模型对数据量的依赖，减少时空开销；在特征融合阶段，引入分频引导注意力机制，精准刻画图像高频细节与低频背景，实现跨频域特征的自适应加权融合，缓解复杂纹理模糊、细节缺失等问题。同时为了保障融合图像的全局视觉与局部细节质量，将多种损失约束进行整合设计加权复合损失函数。在公开经典测试集Lytro和MFFW上的实验结果表明在6项常用评价指标中，该方法均取得最优，充分验证了其有效性。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

基于VL模型蒸馏与LLM解析的三维场景图生成方法

卢亚光, 沈旭昆, 胡勇

2026, 47(2): 360-367. DOI: 10.11996/JG.j.2095-302X.2026020360

HTML

PDF 38 17

针对三维场景图生成任务中点云在语义关系表达能力上存在不足，需要与生成对应图像并融合而导致推理阶段产生额外计算开销的问题，提出一种基于视觉-语言模型(VL model)蒸馏与大语言模型(LLM)的三维场景图生成方法。以三维点云为输入，通过渲染生成对应图像并在特征空间上对齐，实现从视觉-语言模型到图神经网络(GNN)的知识蒸馏，从而建立点云实例与对应文本之间的映射关系，构建点云-语言模型(PL model)。该模型利用LLM增强对复杂语义关系的理解能力，并通过GNN有效聚合节点特征，在不依赖额外图像信息的情况下，捕捉点云的语义和空间关系，实现面向室内环境的三维场景图生成。实验结果表明，该方法不仅能够在开放词表任务中实现对三维室内环境的稳健理解，而且相比依赖VL mode的端到端三维场景图生成方法，可显著降低推理阶段的计算开销和时间成本，体现出良好的性能与实用价值。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

基于检索与变形技术的三维模型重构

庞敏, 李振堂, 张元, 崔晓康, 熊风光

2026, 47(2): 368-379. DOI: 10.11996/JG.j.2095-302X.2026020368

HTML

PDF 37 16

随着虚拟现实(VR)、增强现实(AR)技术的快速发展，对高质量三维模型的需求日益增加。传统建模方法存在处理速度慢、复杂形状适应性差等问题。因此，提出一种基于检索与变形的三维模型构建方法。首先构建一个基于语义关键点的三维模型检索框架，以模型具有的稀疏关键点为基础构建变形感知嵌入空间，实现全局特征与局部特征的动态聚合，同时将自适应全局通道注意力(AGCA)嵌入Transformer构建联合注意力机制，以提升模型的表达能力和检索精度；然后针对检索结果模型设计一套基于DGCNN关键点驱动神经笼变形算法，结合自注意力机制计算关键点对局部支撑区域内顶点的影响权重，根据特征关键点与神经笼结构之间的变形映射，驱动神经笼变形，实现精细且受约束的形变控制；最后结合倒角距离和EMD距离约束，改进损失函数，在关注局部特征差异同时，更准确地对齐几何细节，实现更精确的三维模型重建。实验验证在开源数据集Partnet和Scan2CAD上进行，并和U-RED，ShapeFlow和KP-RED等网络进行效果对比。实验结果表明本文提出的三维模型构建方法能够有效应对噪声与遮挡问题，其中Partnet数据集上损失函数的平均值分别降低33.33%和41.67%；在Scan2CAD上，损失函数的平均值基于baseline降低了3.6%。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

PDF-Sketch：基于笔画段距离场与离散扩散的布局式草图生成方法

周金, 周一, 徐鹏飞, 黄惠

2026, 47(2): 380-389. DOI: 10.11996/JG.j.2095-302X.2026020380

HTML

PDF 32 13

草图在概念设计、数字艺术和人机交互等领域具有重要价值，但现有基于深度学习的生成方法常依赖折线或贝塞尔曲线进行几何表征，难以刻画复杂形态，且逐点预测机制易产生累计误差，导致结构偏移与细节缺失。为此，将草图建模为由多个独立笔画段构成的布局结构，提出一种结合离散扩散模型与笔画段距离场（PDF）的生成框架。首先通过自适应笔画分解与笔画自编码器获取笔画段的连续可微特征表示，再利用编码词典机制将高频相似的笔画形态离散化为有限词项，使扩散过程能逐步恢复出结构合理的笔画段集合，实现对笔画段位置、尺寸和形态的联合建模。在QuickDraw数据集上的实验结果表明，该方法在FID，Precision和Recall等指标上均优于对比方法Sketch-rnn与SketchKnitter。在少笔画任务中，模型更好地学习局部几何特征，召回率提升显著；在多笔画任务中，则展现出更高的结构精度和整体保真度。定性结果显示，生成草图在整体一致性、局部细节还原和空间布局协调性方面均明显优于现有方法。研究表明，从布局生成角度出发并结合距离场与离散化机制，能够有效缓解传统序列建模中的误差累积问题，提升草图生成的结构完整性与多样性，为进一步改进笔画段分割、细节恢复及段间连接一致性提供了新的方向。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

基于潜在扩散模型的CAD条件生成

刘景豪, 游振国, 杜冬

2026, 47(2): 390-401. DOI: 10.11996/JG.j.2095-302X.2026020390

HTML

PDF 54 17

基于传统计算机辅助设计(CAD)创建兼具可制造性与可编辑性的三维模型是一项复杂且耗时的任务。近年来，深度学习技术在CAD模型自动化生成方面展现出巨大潜力并成为研究热点。然而，多数CAD生成模型未能充分利用点云、图像和草图等输入数据中蕴含的几何与语义信息，难以通过灵活的条件输入精准控制生成方向。针对这一问题，通过挖掘潜在空间的表征能力，采用去噪扩散概率模型，以这类条件输入数据作为引导，实现CAD模型定向生成。具体而言，首先构建基于Transformer架构的自编码器，将CAD参数命令序列编码至潜在空间；进而在此空间内搭建去噪扩散概率模型，融合点云、图像或草图条件编码信息，生成CAD特征向量；最后通过解码器还原为三维CAD模型。实验结果表明，所生成的CAD模型结构合理、表面光滑且几何特征清晰，相较于现有方法，在生成形状多样性、分布相似性与保真度之间实现了较好的平衡，且当以点云、图像或草图作为条件输入时，均能有效提升CAD模型的生成质量。相关代码已开源，详情可见 https://github.com/Ziyou-maker/LDM4CAD。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

基于叶片几何特征的精加工刀具轨迹生成

涂艺豪, 马文扬, 闫光荣

2026, 47(2): 402-410. DOI: 10.11996/JG.j.2095-302X.2026020402

HTML

PDF 41 13

航空发动机叶片作为航空制造领域的核心零件，其复杂几何特征与高精度要求导致精加工过程中面临切削力波动大、刀具磨损严重等挑战。为在复杂曲面加工中实现切削力稳定控制，提出一种融合叶片几何特征分析与切削参数优化的刀具轨迹规划方法。首先，基于微元切削理论建立切削力计算模型，分析叶片曲面特征、切削参数和切削力之间的关系；然后，针对传统等参数轨迹中切削参数固定导致力波动的问题，采用变尺度混沌算法对刀轴倾角、进给速度和切削深度3个切削参数进行协同优化，建立了以最小化切削力波动为目标的参数优化模型；最后，基于叶片几何特征计算走刀步长和走刀行距，采用等参数线法规划刀触点轨迹，通过切削力计算和切削参数优化确定每个加工路径点的刀轴倾角等切削参数，生成完整的叶片精加工刀具轨迹。结果表明，该刀具轨迹生成方法通过优化切削力的分布，实现了加工过程中切削力平滑，可以降低刀具的疲劳损伤和磨损，保证刀具使用寿命。该研究为复杂曲面零件的精密加工提供了一种基于力控的轨迹规划新思路。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

基于深度信念网络的非标刀具设计知识挖掘与重用研究

王明微, 赵建骅, 孙志宏, 睢鹏, 路晓君

2026, 47(2): 411-422. DOI: 10.11996/JG.j.2095-302X.2026020411

HTML

PDF 26 6

非标刀具设计中刀具特征与零件加工特征之间具有强耦合的关联关系，是一种典型隐性设计知识，具有数据多模态性和多维不确定性，导致难以捕获和重用，因此提出了基于深度信念网络(DBN)的刀具设计知识挖掘与重用方法。首先，面向加工特征和刀具特征所具有的二维图像和属性文本2种模态数据，设计了一种双通道DBN实现了特征的提取与融合。其次，设计了一种面向关联关系挖掘的DBN，实现加工特征与刀具特征之间隐含关系的获取。最后，通过关联规则推理和改进Rake算法对已有刀具案例进行评价和实现重用。以非标专用内孔槽刀设计过程为例，通过重用结果与实际结果在结构信息和属性信息方面的对比，验证了方法的有效性。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

基于L型靶标的相机标定及文物二维数字化

赵敏, 王妞娜, 严潼颖, 朱凌建

2026, 47(2): 423-431. DOI: 10.11996/JG.j.2095-302X.2026020423

HTML

PDF 34 10

在可移动文物的二维数字化保护与研究中，需要提供文物正摄图及文物外形尺寸。相机标定不仅能校正成像畸变，还能提高精度。仿真分析表明，相机标定精度取决于靶标占视场大小，L型靶标具有和矩形靶标相近的精度。因此，提出基于L型靶标的相机标定方法及文物外形尺寸计算方法，设计了具有方向标志的L型靶标及靶点匹配方法，可根据文物成像视场选取合适靶标范围进行标定，保证了标定精度。由于设计的靶标不遮挡文物，且能同步完成相机标定与文物正摄图采集工作，精准获取相机内外参数，通过三维坐标数据实现文物尺寸的高精度计算。实验结果表明，L型靶标的靶点识别和匹配方法准确，相机标定参数能够有效校正文物图像畸变，不同文物的外形尺寸测量精度均优于0.2 mm，较比例尺方法精度提高超过一个数量级，能为可移动文物二维数字化记录和保护提供重要技术支持。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

基于模型的复杂系统方案多维度综合权衡方法研究

贺文虎

2026, 47(2): 432-439. DOI: 10.11996/JG.j.2095-302X.2026020432

HTML

PDF 33 8

复杂系统设计初期方案评估的科学性对研制成功至关重要。针对传统方案评估中存在的依赖专家经验、视角单一和数据关联性差等问题，提出一种基于模型的系统方案多维度综合权衡分析方法。借助基于模型的系统工程(MBSE)在架构建模与仿真方面的技术优势，首先构建了覆盖性能、技术、成本及周期的多维度指标体系；进而通过系统建模语言建立系统架构与参数模型的映射关系，实现了权衡指标与子系统参数的动态关联；在此基础上，采取参数归一及考虑正负收益的加权求和策略，并创新性地利用SysML参数图构建了多维度指标体系下的复杂系统综合权衡模型，并建立了七步法多维度综合权衡的分析流程。以航空发动机方案权衡为例进行验证，结果表明，该方法能够高效地对多个备选方案进行自动化综合评估和排序，验证了方法的工程实用性以及模型的有效性，为复杂系统方案评估提供了有效的模型化支持手段。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

基于图论的建筑风系统阻力自动化计算方法和工具研发

江凯, 许璟琳, 余芳强

2026, 47(2): 440-448. DOI: 10.11996/JG.j.2095-302X.2026020440

HTML

PDF 33 17

在建筑机电系统中，风系统的阻力计算是暖通空调设计与优化的关键环节。传统方法依赖人工识别最不利环路并逐段计算阻力，存在效率低、易出错等问题，难以适应复杂工程需求。随着建筑信息模型(BIM)技术的发展，基于Revit模型进行自动化分析已成为提升设计质量的重要手段。研究提出了一种基于图论的建筑风系统阻力自动化计算方法，以Revit MEP模型为基础，通过API接口提取风系统构件拓扑关系，并将其抽象为一张无向图，其中管件作为节点，管道作为边。利用广度优先搜索(BFS)算法从风机出发遍历整个风系统，识别所有连接风口，并构建以风机为根节点、风口为叶子节点的树状结构。在此基础上，采用自下而上的深度优先回溯策略，逐层计算各节点下游风量，并结合局部阻力系数与沿程阻力公式，完成每条路径的总阻力计算。最终，通过比较所有路径的阻力值，识别出最不利环路，实现风系统阻力的智能化、自动化分析。基于该方法开发了集成于Revit平台的自动化计算插件，并在上海某大型实验室项目中完成应用验证。案例中对144台风机进行了全回路复核，结果显示有28台风机原选型无法满足系统阻力要求，同时计算效率较传统人工方式提升约37倍。研究成果为风机选型、节能优化及后续运维管理提供了可靠的数据支持，具有良好的工程应用前景。

数据和表 | 参考文献 | 相关文章 | 计量指标

Select

2026年第2期样刊

2026, 47(2): 449.

PDF 19 8

过刊目录