欢迎访问《图学学报》 分享到:
双月刊,创刊于1980年
主管单位:中国科学技术协会
主办单位:中国图学学会
编辑出版:《图学学报》编辑部
主  编:汪国平
编辑部主任:侯晓红
ISSN 2095-302X
CN 10-1034/T
当期目录
2025年, 第46卷, 第5期 刊出日期:2025-10-30 上一期   
全选选: 隐藏/显示图片
封面
2025年第5期封面
2025, 46(5): 1. 
PDF 11     10
相关文章 | 计量指标
目次
2025年第5期目次
2025, 46(5): 2. 
PDF 8     13
相关文章 | 计量指标
序言
综述
视觉图灵三境界:大模型时代下视觉智能进展与展望
黄凯奇, 武美奇, 陈宏昊, 丰效坤, 张岱凌
2025, 46(5): 919-930.  DOI: 10.11996/JG.j.2095-302X.2025050919
HTML    PDF 35     21

视觉图灵是通过图灵评测的方式对计算机视觉模型进行评估,为计算机视觉的发展提供了类人评估基准。随着大模型时代的到来,计算机视觉技术的飞速发展极大提升了视觉能力,尤其在图像分类、物体检测分割以及视频理解等领域表现出色。然而,与人类视觉相比,这些算法在适应性、跨场景泛化和高层次认知推理等方面仍存在显著差距。本文从视觉图灵的三重境界(看所见、看所知和看所想)出发对视觉智能发展进行了梳理,对大模型时代下智能技术面临的瓶颈与挑战进行了整理和分析,介绍了视觉智能从物理世界感知到语义理解认知再到主观心理建模的能力跃迁路径,为推动计算机视觉技术更加接近人类的视觉感知与认知能力的发展提供了思路。

数据和表 | 参考文献 | 相关文章 | 计量指标
自动驾驶图像合成方法综述:从模拟器到新范式
黄敬, 时瑞浩, 宋文明, 郭和攀, 魏璜, 魏小松, 姚剑
2025, 46(5): 931-949.  DOI: 10.11996/JG.j.2095-302X.2025050931
HTML    PDF 15     9

图像合成技术对自动驾驶的发展至关重要,旨在低成本、高效率地为自动驾驶系统提供训练和测试数据。随着计算机视觉和人工智能(AI)技术的发展,神经辐射场(NeRF)、三维高斯溅射(3DGS)和生成模型在图像合成领域引起了广泛关注,这些新范式在自动驾驶场景构建和图像数据合成中表现出巨大潜力。鉴于这些方法对于自动驾驶技术发展的重要性,回顾了其发展历程并搜集了最新研究工作,从自动驾驶图像合成问题的实际角度重新观察相关方法,介绍了NeRF、3DGS、生成模型以及虚实融合的合成方法在自动驾驶领域的进展,其中尤其关注NeRF和3DGS这2种基于重建的方法。首先,分析了自动驾驶图像生成任务的一些重要问题;然后,从自动驾驶场景面临的有限视角问题、大规模场景问题、动态性问题和加速问题4个方面详细分析了NeRF和3DGS的代表性方案;考虑到生成模型对于创建自动驾驶极端场景(corner case)的潜在优势,还介绍了自动驾驶世界模型用于场景生成的实际问题及现有研究工作;接着,分析了当前业内虚实融合自动驾驶图像合成前沿应用,以及NeRF和3DGS结合AI生成模型在自动驾驶场景生成任务中的潜力;最后,总结了当前取得的成功及未来亟需探索的方向。

数据和表 | 参考文献 | 相关文章 | 计量指标
图像处理与计算机视觉
基于自适应特征融合金字塔与注意力机制的输电线路绝缘子缺陷检测方法
翟永杰, 翟邦朝, 胡哲东, 杨珂, 王乾铭, 赵晓瑜
2025, 46(5): 950-959.  DOI: 10.11996/JG.j.2095-302X.2025050950
HTML    PDF 16     16

针对输电线路绝缘子缺陷样本中存在的复杂背景干扰及缺陷区域尺度不一问题,提出了一种基于自适应融合特征金字塔与注意力机制的输电线路绝缘子缺陷检测方法。首先,利用自适应融合模块(AF)来处理不同尺度的特征信息,并将其集成到特征金字塔网络之中,以缓解绝缘子航拍图像中存在的缺陷区域尺度不一问题。然后,基于注意力机制的缺陷特征细化模块(DFRM),通过增大感受野以及捕获缺陷区域的上下文特征来应对复杂背景噪声所带来的干扰。最后,将改进后的算法应用到真实输电线路绝缘子缺陷数据集进行实验。实验结果表明,该方法在绝缘子缺陷检测任务中优于其他方法,相较于基线模型准确率提升了5.7%,为电网智能巡检提供了一种有效方案。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于大型视觉语言模型的施工现场安全监控研究
冷烁, 王玮, 欧家勇, 薛志刚, 宋英龙, 莫斯钧
2025, 46(5): 960-968.  DOI: 10.11996/JG.j.2095-302X.2025050960
HTML    PDF 14     16

针对施工安全监控过程中,传统视觉模型构建成本高、应用范围窄等问题,提出一种基于大型视觉语言模型(LVLM)的全新解决方案。基于开源预训练LVLM,提出包括文本提示、图像附加信息、图像样本提示等多类适用于施工安全监控任务的提示词策略,实现LVLM对施工监控图像的理解与推理,并设计了基于LVLM的智能监控工作流程与系统架构。研究成果被应用于管理人员离岗识别、危险区域侵入识别、以及违规施工行为识别等多项典型施工安全监控场景。实际数据验证表明,通过合适的提示词策略,LVLM无需数据标注与模型训练,便可实现接近主流深度学习模型的识别准确率,同时具有构建成本低、落地速度快、任务适应灵活等优势,在图像识别与智能监控领域具有应用潜力。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于SAM2的腹腔镜手术多目标自动分割方法
刘成, 张家意, 袁烽, 张睿, 高欣
2025, 46(5): 969-979.  DOI: 10.11996/JG.j.2095-302X.2025050969
HTML    PDF 16     16

腹腔镜术中场景的自动分割是手术机器人实现自主操作的关键基础,当前仍面临三重挑战:手术目标间纹理高度相似且边界模糊,导致相似目标难以精确分割;从亚毫米级缝合线到厘米级脏器组织存在显著尺度差异,制约了多目标同步分割精度提升;运动伪影和烟雾遮挡等干扰进一步影响术中多目标完整分割的鲁棒性。为此,提出基于视觉大模型SAM2的腹腔镜手术多目标自动分割方法(SAM2-MSNet)。采用LoRA+微调策略优化SAM2图像编码器,高效适配腹腔镜图像的纹理特征表达;设计跨尺度特征同步提取模块,实现多尺度目标的精确分割;构建特征关系全局感知模块,增强网络对运动伪影及烟雾遮挡等干扰的鲁棒性;并引入方向梯度直方图驱动的伪标签辅助监督机制,显著提升目标边缘分割精度。实验结果表明,SAM2-MSNet在Endovis2018和AutoLaparo数据集上分别取得了70.2%和69.6%的平均交并比(mIoU),和78.5%和75.0%的平均Dice系数(mDice)。在推理速度与SAM2-UNet相当(23帧/秒 VS. 25帧/秒)的前提下,其分割精度显著提升了3.0%和6.7% (mIoU)和2.8%和6.8% (mDice)。SAM2-MSNet实现了对腹腔镜手术场景高精度全自动分割,为手术机器人自主化进程提供了关键技术支撑。

数据和表 | 参考文献 | 相关文章 | 计量指标
PanoLoRA:基于Stable Diffusion的全景图像生成的高效微调方法
叶文龙, 陈斌
2025, 46(5): 980-989.  DOI: 10.11996/JG.j.2095-302X.2025050980
HTML    PDF 14     14

全景图像能表达周围环境整体的信息,已成为构建虚拟场景的重要表达方式之一。但在人工智能生成内容(AIGC)技术,尤其是大规模文本-图像数据集上训练的扩散模型和高效参数微调技术(PEFT)兴起的浪潮中,全景图像的生成和快速迁移的研究却尚不充分。因此,针对全景图像数据集稀少、空间失真的特点,收集了一个总计14 000张的开源全景图像数据集,通过投影转换对其进行了精细化的文本标注与筛选,在此基础上,提出了PanoLoRA方法。该方法在原有的卷积和自注意力模块提取空间特征的过程中,额外添加了球面卷积和LoRA模块,显式地提取全景图像球面特征,并与原有平面特征相融合,从而在保留了Stable Diffusion原有的强大图文生成能力的同时,实现了全景图像生成的高效迁移学习。实验结果表明,PanoLoRA在所收集到的文本-全景图像数据集上与最新的5种参数高效微调方法进行了比较,并取得了全面的优势,提高了图像生成的质量和图文一致性,并进行了一系列消融实验,验证了每个算法模块的有效性。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于物理信息神经网络的通用网格生成方法
张浩轩, 李海生, 王敏, 李楠
2025, 46(5): 990-997.  DOI: 10.11996/JG.j.2095-302X.2025050990
HTML    PDF 15     12

在数值模拟中,结构网格的生成往往需要大量的时间和人力投入。结构网格生成的一般方案是寻找计算域和物理域之间的映射,这种映射可以通过求解偏微分方程获得。然而,现有的结构网格生成方法难以同时保证效率和网格质量。针对上述问题,提出了一种基于物理信息神经网络的通用网格生成模型(UMG-PINN)。该模型将网格生成任务作为一个从计算域到物理域的网格变形问题,以边界曲线为输入,利用注意力网络捕捉计算域与物理域之间的潜在映射,为输入的物理域生成结构网格。UMG-PINN在损失函数中引入线性弹性力学中的Navier-Lamé方程作为底层控制方程,确保神经网络在优化损失值时符合弹性体变形规律。由于该模型是自监督的,所以不需要先验知识或数据集,减少了以往制作结构网格数据集的工作量。实验结果表明,UMG-PINN相比传统的超限插值法能够生成更高质量的结构网格。此外,UMG-PINN在物理信息的约束下,也可以应用于非结构网格生成。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于均值漂移与深度学习融合的小语义点云语义分割
朱泓淼, 钟国杰, 张严辞
2025, 46(5): 998-1009.  DOI: 10.11996/JG.j.2095-302X.2025050998
HTML    PDF 7     9

在点云语义分割领域,准确分割小语义对象一直是一个重要且具有挑战性的问题。点云数据通常具有稀疏性和不规则性,尤其是在面对小物体或远距离物体时,现有的全监督点云分割算法往往无法有效地捕捉这些小语义对象的特征,导致分割精度较低。这种问题在自动驾驶、机器人导航和城市建模等应用中尤为突出,因为这些任务通常依赖于对小物体的准确识别与定位。为解决此问题,提出了一种基于均值漂移与深度学习融合的小语义点云分割算法。分析了现有点云分割算法在处理小语义对象时的不足,重点阐述了由于小物体的稀疏性和局部特征弱,现有方法往往未能有效提取其语义信息。为此,将均值漂移引入深度神经网络中,作为一种特征提取模块,以提高对小语义对象的关注度。在网络架构设计上,还特别设计了特征处理模块和小语义对象邻域捕获模块。特征处理模块有效地增强了小物体的局部特征,帮助网络在复杂背景中更好地区分小物体与大物体;而小语义对象邻域捕获模块则进一步聚焦于小物体周围的上下文信息,使得模型能够在局部区域内捕捉到更精确的语义特征。通过在多个点云数据集上的实验评估表明,在分割小语义对象上,尤其在稀疏、小物体密集场景下,改进后的方法有效地提高了分割精度。综上所述,基于均值漂移与深度学习融合的小语义点云分割算法为小语义对象的准确分割提供了一种有效的解决方案,具有广泛的应用前景和实际意义。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于深度强化学习的无人机三维场景导航方法研究
刘伯凯, 殷雪峰, 孙传昱, 葛慧林, 魏子麒, 姜雨彤, 朴海音, 周东生, 杨鑫
2025, 46(5): 1010-1017.  DOI: 10.11996/JG.j.2095-302X.2025051010
HTML    PDF 9     12

近年来,无人机产业规模与应用需求不断扩大,实现无人机的自主化和智能化成为了行业内亟待解决的核心问题。无人机导航作为无人机自主控制领域的基础技术,已然成为无人机应用研究的重中之重。目前大多数无人机导航方法依赖于环境信息的重建,消耗过多的计算和内存,无法满足日益复杂的场景与实时性要求。因此,基于深度学习卓越的表征学习能力与强化学习的自主学习决策能力,提出无人机自主导航方法,通过不断自主学习优化决策策略,更好地完成导航任务。首先构造连续性动作空间以及非稀疏性奖励函数,用来引导无人机的学习过程;并设计特征提取模块与决策模块来提高无人机感知能力和决策能力。实验结果表明,在仿真三维场景下,该算法表现出最优的导航避障性能,在所设计的三维场景下导航成功率可达到87%,平均累计奖励收敛值较同期方法提高33%,同时缩短训练时长,提高训练稳定性。

数据和表 | 参考文献 | 相关文章 | 计量指标
计算机图形学与虚拟现实
多视图协同的海洋热浪可视分析
贺琪, 解秋寒, 黄冬梅, 陈括, 王建
2025, 46(5): 1018-1027.  DOI: 10.11996/JG.j.2095-302X.2025051018
HTML    PDF 4     10

在全球气候变暖不断加剧的背景下,海洋热浪的发生频率和强度持续攀升,对海洋生态系统和沿海经济活动产生了严重影响。针对现有研究方法难以全面捕捉海洋热浪多因子耦合、多尺度交互的复杂特性,特别是在时空动态演变过程的量化表征方面存在明显不足的问题,提出了融合高维时空特征的多视图协同分析方法。首先基于时空图卷积网络(ST-GCN)的特征提取技术,通过构建包含热浪强度、频次和持续时间等指标的多维特征矩阵,结合改进的Delaunay三角剖分算法建立动态空间邻接关系,实现了对海洋热浪时空演变规律的精准刻画。其次,创新性地设计了支持多要素关联分析的可视化系统,采用多维标度法和HDBSCAN聚类算法,能够深入解析海洋热浪事件与海表温度异常、风速场等关键环境驱动因子之间的非线性耦合关系。该系统通过多视图协同交互能够直观探索海洋热浪的时空分布模式及驱动机制。

数据和表 | 参考文献 | 相关文章 | 计量指标
DRec:大语言模型驱动的数据分析推荐系统
陈治彰, 封颖超杰, 翁罗轩, 沈健, 陈为
2025, 46(5): 1028-1041.  DOI: 10.11996/JG.j.2095-302X.2025051028
HTML    PDF 9     13

自然语言交互系统极大地简化了用户与数据分析的交互流程,允许用户通过自然语言来完成数据分析和图表绘制。随着大型语言模型(LLM)的兴起,近年来LLM驱动的自然语言数据分析系统逐渐成为一种趋势。LLM凭借其出色的逻辑推理和工具调用能力,能够生成更为复杂的逻辑推断和图表。尽管如此,依靠LLM进行的交互式数据分析仍充满挑战。数据分析师在分析过程中必须明确分析方向以推动交互式分析的进行,通常要求其对数据有深入的了解。此外,使用LLM进行数据探索时,分析师因为较少直接操作数据,致使对数据的理解不足,从而影响对分析流程的整体掌控。为了帮助用户明确分析流程、加深对数据的理解,提出一种基于推荐和关联的LLM数据分析系统DRec。该系统通过关联信息帮助用户建立起对数据的认知,并引导数据分析的流程。同时,系统从语义和数据2个维度为用户提供洞察,并据此推荐查询,以协助用户确定数据分析的方向。通过案例研究和用户实验,证明DRec系统能够提高数据分析效率并引导用户获得合理的数据分析结果。

数据和表 | 参考文献 | 相关文章 | 计量指标
跨越开边界的测地距离传播
岳子佳, 王文嵩, 陈双敏, 辛士庆, 屠长河
2025, 46(5): 1042-1049.  DOI: 10.11996/JG.j.2095-302X.2025051042
HTML    PDF 10     10

在数字几何处理领域,曲面上测地距离的计算是一项基本且关键的任务。在计算过程中,每个表面点同时扮演着接收器与发射器的角色,以实现整个曲面上的距离传播。当存在开边界缺陷时,已有算法尝试在外蕴空间中填补孔洞和缝隙。然而,其在应对高度弯曲处出现的开边界缺陷时仍显不足。为此,提出在不补洞的情况下让距离传播自然跨越孔洞的新思路。观察发现,传统算法在跨越孔洞后,会形成一个“阴影”区域;该区域内的最短路径经由孔洞的边界,从而产生了比真正测地距离更大的结果。基于该观察,对经典的快速行进法(FMM)进行了3项重要改进:首先,仅将边界点视为距离接收器,阻止向其他点传播距离;其次,允许每个点向前后2个方向传播距离,使得阴影区域内的点可以从周边的可见点获得测地距离;最后,通过调整距离传播的优先级实现“由近及远”和“从可见区域到阴影区域”这2种传播方式之间的平衡。实验证明,即使是极为复杂的开边界缺陷,该方法依然产生接近于真解(模型没有缺陷情况下)的测地距离。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于超图表示学习和Transformer模型优化的知识感知推荐
左屿琪, 张云峰, 张秋悦, 徐英城
2025, 46(5): 1050-1060.  DOI: 10.11996/JG.j.2095-302X.2025051050
HTML    PDF 9     10

基于知识图谱的推荐算法是近年来推荐系统领域的一个研究重点和热点,这主要是因为引入知识图谱,能够获得项目的辅助信息,从而极大地增强了推荐系统的能力,为用户带来更为精准和个性化的推荐体验。为此,提出一种基于超图表示学习和Transformer模型优化的知识感知推荐模型,利用超图在处理高阶关系上的独特优势,直接对用户与项目之间复杂的交互信息进行建模,从而极大地丰富了其交互信息。因局部图缺少用户与项目之间的全局交互信息,因此在局部图中构造全局超图;而非局部图存在冗余信息,在非局部图中构造非全局超图,从而捕获用户与项目之间更全面的交互信息。同时,利用Transformer模型的注意力机制增强用户节点与项目节点之间的协作关系,并从用户点击不感兴趣的项目且有噪声的用户交互数据中挖掘更有价值的偏好信息,优化用户与项目节点的嵌入,以缓解噪声干扰,提升对用户偏好的推荐性能。

数据和表 | 参考文献 | 相关文章 | 计量指标
数字化设计与制造
基于运动学原理的复合材料编织成型工艺仿真技术研究
吴浩宇, 杨小超, 王伟, 赵罡
2025, 46(5): 1061-1071.  DOI: 10.11996/JG.j.2095-302X.2025051061
HTML    PDF 10     11

围绕编织机控制数据、纱线轨迹以及编织角的计算与预测设计的,提出一种编织复合材料成型过程的仿真算法,从2个相反的过程展开,逆向求解基于目标编织结构生成可靠的编织机控制数据,正向求解依据输入的编织机控制数据计算纱线轨迹,从而得到编织结构。首先将芯轴表面划分为一系列三角面片的集合并将其作为程序输入,提取芯轴中心线,依照运动学原理进行局部求解,由逆解算法生成设定编织角下的编织结构并得出相应编织速度,由正解算法计算特定编织速度以及编织机控制参数下的纱线轨迹和编织角分布情况。基于FreeCAD平台开发了BraidSim模块以实现编织工艺的动态仿真,支持对芯轴表面网格剖分、期望轨迹与编织速度生成与纱线沉积的动态仿真等功能。通过圆形变截面芯轴、方形变截面芯轴、航空发动机进气道芯轴以及空间曲线芯轴等典型编织案例进行仿真实验,仿真结果得到的编织速度与编织角分布基本符合预期,另外对变截面芯轴以及弯曲中心线芯轴进行了仿真并生成了相应的逆解编织机控制数据以及编织角分布情况,证实了该算法在复杂芯轴中的工程适用性。

数据和表 | 参考文献 | 相关文章 | 计量指标
航空发动机健康管理系统功能架构分析与研究
詹轲倚, 黄维娜, 淳道勇, 桂咏涛, 张椿林
2025, 46(5): 1072-1084.  DOI: 10.11996/JG.j.2095-302X.2025051072
HTML    PDF 15     9

针对复杂系统需求边界模糊与架构动态优化难题,融合MagicGrid方法论,提出了“场景-需求-功能-逻辑-物理”五层协同建模框架。基于系统建模语言在MagicDraw平台开展航空发动机健康管理系统功能架构分析与研究:①通过内部块图建立利益相关方交互关系拓扑,实现场景驱动的系统边界定义;②利用需求图构建可追溯性矩阵,完成场景验证与需求完整性分析;③基于用例图-活动图动态组合建模功能行为,经模块化分解形成技术独立的逻辑架构;④通过块定义图与内部块图构建物理模型,借助接口标准化实现逻辑组件与物理实体的解耦设计。案例验证表明,该方法在降低功能重叠率、提升预测效率、敏捷评估状态影响并降低虚警率上具有显著成效。研究成果不仅构建了航空发动机健康管理系统的全生命周期建模范式,实现了场景-需求-功能-物理全链条追溯,拓展了图学方法在MBSE领域的工程应用场景,其多视图协同建模机制对复杂装备系统设计具有普适参考价值。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于改进红鸢优化算法与LSTM的核电换热器寿命预测方法
鲜思渔, 赵泽田, 吴轩宇, 冯毅雄, 薛杨, 张志峰
2025, 46(5): 1085-1093.  DOI: 10.11996/JG.j.2095-302X.2025051085
HTML    PDF 6     8

随着核电设备数量的增加和种类的多样化,基于状态检测的预测性维修策略逐渐成为核电厂关注的重点,特别是对关键设备如冷却水换热器进行剩余使用寿命预测。因此提出了一种结合改进红鸢优化算法(IROA)与长短期记忆网络(LSTM)的换热器寿命预测方法,旨在克服传统方法在超参数调优方面的局限性,并提高预测精度。针对现有方法中初始种群多样性不足导致过早收敛的问题,引入遗传算法中的交叉和变异操作改进了ROA算法,以增强种群多样性和跳出局部最优解的能力。通过利用历史退化数据训练LSTM模型,详细分析了不同超参数组合对模型性能的影响,并证明了优化后的超参数组合能够显著提升预测效果。为了验证该方法的有效性,将IROA-LSTM与其他常见预测方法(如SVM、CNN、RNN、标准LSTM)及其他几种优化算法进行了对比实验,并且还设置了噪声干扰实验。结果表明,IROA-LSTM不仅在各项性能指标上表现出色,还展示了较强的鲁棒性和稳定性,能够在不同条件下保持较高的预测精度。为制定科学合理的维修策略提供了可靠的数据支持,有助于提高核电厂设备运行的安全性和经济性。

数据和表 | 参考文献 | 相关文章 | 计量指标
双支链式侧翻辅助装置机构设计与运动学图形表征分析
刘征, 潘国新, 姚鹏震, 刘甜, 苏鹏
2025, 46(5): 1094-1104.  DOI: 10.11996/JG.j.2095-302X.2025051094
HTML    PDF 6     9

定期侧翻是长期卧床患者预防压疮的重要护理措施,现有侧翻辅助装置机械式结构刚性较大,未考虑人体侧翻运动机理,充气式存在人体关节转动中心和机构转动中心不一致,易导致患者在侧翻过程中受伤,因此,研究人机运动协同的仰卧位侧翻辅助装置设计具有十分重要的意义。依据人体侧翻运动机理的研究基础,设计了一种由平面连杆机构驱动双支链结构的侧翻辅助装置,主要受力位置为肩部和臀部,通过建立数学模型并推导设计参数,利用图解法分析连杆传动角,同时进行装置的运动学仿真、工作空间分析与人体侧翻重心轨迹提取实验,对整体装置进行运动学图形表征分析。结果表明:辅助人体侧翻角度为30°~45°,该角度范围内人体与双支链接触应力分布较为均匀,有助于预防压疮。机构传动角范围为42.19°~90.00°,该角度范围机构具有良好的传力性能。研究验证了装置设计的合理性,双支链结构能够拟合肩部和臀部的运动过程,提供多段式支撑链接触,避免局部压力集中,符合人-机协同性与人机工程学的康复辅具设计要求,为侧翻康复研究奠定了基础。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于CFD的仿鱼机器人多模式游动机理研究
夏明海, 罗自荣, 殷谦, 卢钟岳, 蒋涛
2025, 46(5): 1105-1112.  DOI: 10.11996/JG.j.2095-302X.2025051105
HTML    PDF 12     9

仿鱼机器人是一种新型水下航行器,具有噪音低、可靠性高、环境友好等突出优势。为探究仿鱼机器人双鳍驱动游动机理,基于计算流体力学方法进行机器人多模式运动性能数值仿真。推导了机器人运动学与动力学模型,建立了波动鳍空间运动方程。在Fluent软件中建立了机器人流体仿真模型,设计了力与运动耦合动网格仿真算法。仿真结果表明,机器人可以通过双侧波动长鳍的配合,实现前进后退、机动转弯、原地转向等多模式运动。机器人的推进力与波动频率平方成正比,机器人的游动速度、转弯速度均与波动频率成正比。频率为6 Hz时,仿真得到机器人的游动速度达到1.25 m/s,转向速度达到3.2 rad/s。研究结果验证了仿鱼机器人设计合理性与多模式运动性能,为机器人物理样机优化设计与运动控制提供理论参考与计算支撑。

数据和表 | 参考文献 | 相关文章 | 计量指标
建筑与城市信息模型
基于YOLO和自然语言处理的施工方案智能审核方法
钱增志, 孙玉龙, 张捷, 夏侯遐迩, 周大兴, 康伟德
2025, 46(5): 1113-1122.  DOI: 10.11996/JG.j.2095-302X.2025051113
HTML    PDF 8     9

建筑施工方案的人工审核存在重复性高、耗时费力且占用专家资源等问题。为提升审核效率,促进企业智能建造发展,提出一种施工方案智能审核方法,通过审核规则编制、向量模型构建及图像文字识别技术结合,实现多类型方案智能审核。审核规则基于集团技术文件和历史审核意见样本,经历史高频审核意见筛选与专家研判后,采用正则表达式技术进行逐条编制。研究构建了基于语义相似度比对的审核模式,将方案文本内容嵌入向量空间,通过计算向量余弦相似度实现语义比对,从而提升审核灵活性与容错性。同时,引入基于YOLO的图像文字识别技术,处理文档图片中的文字内容,确保审核全覆盖。实验结果显示,系统平均审核准确率达90.4%,审核时间效率较人工提升87.9%,且能处理多种格式文本输入,具备良好鲁棒性,显著提高审核工作效率,对企业数字化转型与智能建造技术普及具有重要推动作用。目前,搭载此审核技术的平台已在集团多家分公司与项目应用测试,能生成准确的审核报告,实现审核效率显著提升。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于Weisfeiler-Lehman核增强的无监督BIM构件检索方法
扈慧强, 贺长雁, 刘小军, 贾金原, 高路
2025, 46(5): 1123-1133.  DOI: 10.11996/JG.j.2095-302X.2025051123
HTML    PDF 6     11

针对建筑行业对构件检索的迫切需求,提出一种面向工业基础类(IFC)数据特点的无监督建筑信息模型(BIM)构件检索方法。充分利用IFC标准中的语义和几何信息,构建了构件属性图(PAG)作为构件特征,并结合PAG的多属性通道,提出基于Weisfeiler-Lehman (WL)核增强的PAG同构预测思路,以实现BIM构件检索。该方法支持以2个IFC文档作为输入,其中文档A代表待检索的构件,文档B则为构件库,最终返回B中与A相似的构件。主要贡献在于:①提出一个无须数据预处理且兼容语义信息的BIM构件检索框架;②引入BIM构件的PAG特征构建方法,同时,给出WL图核增强的PAG同构预测方法;③设计了无监督的收敛性判断策略,通过分析预测结果中的属性差异及时判断算法的收敛状态。实验结果表明,该方法的PAG同构测试能在不超过3次迭代的情况下收敛,实验环境下BIM构件的同构测试不超过1 s,构件搜索的平均准确率达95%。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于非平衡最优传输理论的拉索式幕墙面板尺寸检测方法
谭立云, 刘界鹏, 李汉涛, 曾焱, 廖岳, 吴小峰, 崔娜
2025, 46(5): 1134-1143.  DOI: 10.11996/JG.j.2095-302X.2025051134
HTML    PDF 4     11

玻璃幕墙因独特的美感和强大的塑型能力被广泛应用于大型场馆和地标建筑,其施工流程为先施工龙骨支撑系统再进行玻璃面板的安装与调试,但在具体操作时,建成龙骨的轴线通常与设计轴线有所偏差,导致后续玻璃面板施工困难。本文开展基于非平衡最优传输理论的幕墙点云轴线提取研究。该方法充分利用点云数据信息,结合非平衡最优传输理论,包括输入点云数据、点云数据预处理、随机采样获得初始轴线点集、提取杆件粗轴线和提取杆件精轴线等步骤,以此获得目标点云的轴线特征,后续再根据提取到的轴线获取幕墙尺寸。实验结果表明,该方法能有效提取幕墙龙骨的轴线,且具有良好的中心性与鲁棒性。通过与其他算法进行比较,证明了其有效性。计算得到的幕墙尺寸与实际测得的结果相比,误差在±2 mm内,在允许误差范围内。

数据和表 | 参考文献 | 相关文章 | 计量指标
工业设计
基于图结构扩散模型的作业车间调度问题求解
余克雄, 何鸿君, 易任娇, 赵航, 徐凯, 朱晨阳
2025, 46(5): 1144-1151.  DOI: 10.11996/JG.j.2095-302X.2025051144
HTML    PDF 7     9

作业车间调度问题(JSSP)是经典的离线组合优化问题,广泛应用于工厂排产,物流配送等领域。作为NP-hard问题,其求解复杂度随作业和机器数量呈指数级增长。然而,传统的精确算法难以应对大规模实例,而现有的启发式和深度学习方法大多未能充分挖掘问题的全局信息,且通常仅能提供单一分布的解,难以满足组合优化问题的多解性。针对这一局限,提出了一种基于扩散概率模型的全局信息预测方法。首先,结合作业车间调度问题的特征和求解约束对扩散概率模型进行迁移,以预测表征最优解分布的概率图。随后,基于概率图的引导进行约束求解与局部搜索优化,充分发挥扩散概率模型的多模态生成优势与对全局信息的编码能力,从而获得符合问题约束的高质量调度方案。为进一步提升算法的求解效率,在国产深度学习框架Jittor上进行了迁移与重构,基于Jittor构建出一套高效的作业车间调度问题求解管线,并在网络推理速度上相较于Pytorch实现了最高40%的推理速度提升。在主流数据集上的实验结果表明,该方法在各类问题规模下均表现优异,取得了最佳的求解质量。据悉,这是首个基于扩散概率模型的作业车间调度问题求解器。

数据和表 | 参考文献 | 相关文章 | 计量指标
本期样刊
2025年第5期样刊
2025, 46(5): 1152. 
PDF 11     8
相关文章 | 计量指标