Please wait a minute...
欢迎访问《图学学报》 分享到:

当期目录

    全选选: 隐藏/显示图片
    封面
    2026年第1期封面
    2026, 47(1): 0. 
    PDF 28     40
    相关文章 | 计量指标
    目次
    2026年第1期目次
    2026, 47(1): 2. 
    PDF 17     8
    相关文章 | 计量指标
    综述
    基于深度学习的肝脏局灶性病变检测方法综述
    董文益, 杨伟东, 唐冰慧, 王琦, 肖宏宇
    2026, 47(1): 1-16.  DOI: 10.11996/JG.j.2095-302X.2026010001
    HTML    PDF 64     29

    肝脏局灶性病变(FLLs)检测对疾病诊断和治疗至关重要。传统检测方法面临诸多挑战,深度学习技术的应用为其带来新契机。鉴于此,系统综述了基于深度学习的FLLs检测方法,通过深入分析相关技术的优势与不足,为FLLs检测技术的发展提供了具体的研究方向。首先对肝脏放射影像的公开数据集进行了整理归纳,阐述数据预处理对提升模型性能的关键作用。其次,对比分析了基于卷积神经网络、Transformer以及知识蒸馏等技术的2D与3D检测算法,揭示了从局部特征建模到全局时空关联的技术演进路径。此外,深入探讨了针对多期相影像的时序特征融合方法,为动态病变表征提供了新思路。研究表明,现有方法在检测精度与效率上取得突破,但仍面临小病灶敏感性不足、跨设备泛化性弱及临床验证缺乏等挑战。未来研究需通过多中心数据协同、轻量化算法设计及可解释性增强等途径,加速深度学习在肝脏病变辅助诊断中的临床转化与应用。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    图像处理与计算机视觉
    融合双重注意力与加权动态卷积的车辆损伤分类模型
    翟永杰, 王紫萱, 张祯琪, 周迅琪, 王乾铭
    2026, 47(1): 17-28.  DOI: 10.11996/JG.j.2095-302X.2026010017
    HTML    PDF 46     22

    针对车险理赔客户上传的车辆损伤图像中存在损伤类型形态相似、分类困难的问题,提出了一种适用于车辆损伤分类的模型ResAWDNet。首先,为有效增强模型对损伤特征的提取能力,使用加权动态卷积代替原有的下采样操作,依据输入特征动态调整卷积核权重,提高模型对不同尺度和方向特征的适应性,从而更准确地捕捉损伤的细微差异。其次,为了使模型关注图像中的显著性判别区域和特征通道,在主干网络的卷积层后嵌入了双重注意力机制,同时学习空间和通道维度上的重要权重,提升模型对关键信息的捕捉能力,进一步提升模型在损伤分类任务中的决策准确性。最后,基于真实事故案例的车辆损伤图片数据集进行实验验证。实验结果表明,ResAWDNet模型在车辆损伤分类任务中切实可行且优势显著,整体分类准确率达到73.79%。与基线模型相比,ResAWDNet在多类损伤类型的分类上均展现出更高的准确率,有力地证明了该模型的有效性。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    基于生成模型的无监督多视点立体视觉网络
    潘宇轩, 金锐, 刘雨, 张琳
    2026, 47(1): 29-38.  DOI: 10.11996/JG.j.2095-302X.2026010029
    HTML    PDF 41     21

    现有的多视点立体视觉研究利用深度估计算法,通过建立物理世界与数字世界的映射关系来实现立体表征。基于有监督学习的神经网络算法通过训练能够取得准确且高保真的三维重建结果。然而,由于缺乏深度先验信息且图像具备大视场的特性,面向自然场景的视觉重建仍然具有挑战性。研究应用无监督学习网络和基于语义优化的神经辐射场(NeRF)渲染,在没有先验信息的情况下实现对自然采集的多视点图像的深度估计。首先通过无监督学习无参考地生成多视点图像初步的深度信息,进一步在独立的NeRF模型中,利用扩散模型建立表面语义渲染损失来实现细粒度的三维表征。在基准数据集上的实验结果表明,该方法与其他最先进的方案相比整体重建的指标平均提高了24.6%;在宽基线数据集的泛化性能验证中,该方法将现有方法测得的重建误差最多降低了40.8%。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    一种基于内存对齐的大模型混合精度量化方法
    李章明, 关伟凡, 常政威, 张凌浩, 胡庆浩
    2026, 47(1): 39-46.  DOI: 10.11996/JG.j.2095-302X.2026010039
    HTML    PDF 31     7

    随着大模型规模的不断增长,模型推理的内存占用和计算开销成为重要挑战。模型量化是降低模型资源消耗的有效方法,但现有方法在权重量化过程中存在离群点处理不足、量化精度损失显著以及内存访问效率低下等问题。为此,提出一种内存对齐的大模型混合精度量化方法,通过将模型参数表示成不同位宽的量化参数实现混合精度量化方法,在降低模型存储的同时缓解量化带来的精度损失问题。具体来说,基于小组显著性分析划分权重离群点,将模型参数按单指令多数据流(SIMD)单元对齐分组,并依据显著性对不同小组采用8 bit或2 bit量化;针对2 bit量化可能导致的精度损失,引入分块量化补偿策略。此外,设计了一种高效的混合精度权重打包与存储方案,通过位图(Bitmap)记录数据块位宽类型,支持随机访问。实验结果表明,该方法在保证模型精度的同时,显著降低了内存占用并提升了计算效率。通过在Llama2-7 B,13 B和70 B上进行验证,相比最先进的方法,在WikiText2和C4数据集上的困惑度(PPL)分别下降8.13,2.84,1.37及5.80,并且量化后的70 B模型相对BF16权重存储约减87%。此外在7个QA数据集上平均准确率提升6.24%。其结果表明,基于内存对齐的大模型混合精度量化方法能够同时提升压缩率、访存效率与模型性能。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    基于不确定性引导的智能强化主动学习图像分类方法
    酒明远, 吴国伟, 宋旭光, 李书攀, 徐明亮
    2026, 47(1): 47-56.  DOI: 10.11996/JG.j.2095-302X.2026010047
    HTML    PDF 30     9

    随着深度学习技术的快速发展,其在图像分类等任务中取得了显著成果。然而,这些模型的成功往往依赖于大量高质量的标注数据,而在实际应用中,标注数据通常稀缺,人工标注过程又极为耗时、费力,限制了模型的推广与应用。近年来,主动学习因其能够在有限标注预算下提升模型性能而受到广泛关注,其核心思想是根据样本的不确定性、多样性或代表性等指标,挑选最有价值的数据进行标注。针对传统主动学习方法多依赖手动设计的启发式采样策略,难以适应不同任务场景,且选择策略难以动态优化等问题,提出一种基于智能强化主动学习(SRAL)的图像分类方法,通过将样本选择过程建模为马尔科夫决策过程,利用强化学习的自适应策略优化能力,引导模型从未标注样本中动态挑选最具价值的样本用于标注。其中,状态由未标注样本提取的特征构成,动作表示是否选择样本进行标注,奖励函数则定义为当前样本加入训练集后模型准确率的变化差值。采用演员-评论家(Actor-Critic)算法进行策略优化,并引入不确定性启发式排序作为辅助信息以提升学习效率。实验结果表明,在CIFAR-10,SVHN和FASHION-MNIST等数据集上,所提出的SRAL方法在相同标注预算下,相比于其他主动学习方法,能够显著提高分类准确率,且在各数据集上均展现出较好的稳定性和泛化能力,验证了SRAL方法在提高图像分类模型性能方面的有效性与优势。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    用于夜视辅助驾驶的轻量化图像眩光去除方法
    李晔, 贾俊洋, 黄冠, 李玉洁, 齐文婷, 刘岩
    2026, 47(1): 57-67.  DOI: 10.11996/JG.j.2095-302X.2026010057
    HTML    PDF 34     5

    夜视环境下,强光源引发的眩光干扰显著降低图像质量,影响夜视辅助驾驶系统的感知性能,现有眩光去除算法面临鲁棒性不足、计算复杂度高以及光源信息丢失等问题。为此,提出了一种面向夜视辅助驾驶的轻量化图像眩光去除方法(NFR-Net+)旨在提升图像清晰度并满足移动端实时计算需求。首先设计特征过滤机制,结合残差连接策略,增强网络对复杂夜视场景的特征提取能力,有效抑制过拟合,从而在不同光照条件和眩光类型下实现稳定的眩光去除效果。其次,引入非线性无激活特征注意力模块,通过轻量化设计构建高效注意力机制,显著提升图像细节重建质量,同时将模型参数量降低约8.28%,运行内存减少约11.1%,大幅优化计算效率。此外,针对传统方法中光源信息过度去除导致图像自然度下降的问题,优化了分割网络中的光源提取模块,通过改进的光源分离策略,精确保留光源区域的亮度和纹理信息,确保输出图像的真实性和自然感。实验结果表明,NFR-Net+在结构相似性(SSIM)、峰值信噪比(PSNR)和学习感知图像块相似度(LPIPS)等图像质量评估指标上均优于现有主流方法,表现出更高的去眩光性能和细节保留能力。同时,该方法在多种夜视场景和不同硬件设备上均展现出良好的适应性,能够满足实时处理的高效性要求,为智能视觉系统在资源受限的移动端部署提供了可行性。进一步的消融实验验证了各模块的有效性,凸显了特征过滤和注意力机制在提升性能与降低资源消耗中的关键作用。且为夜间自动驾驶和智能监控等应用场景提供了高效、轻量化的解决方案。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    无人机视角下施工场景目标检测性能评估
    宋琢, 卢德辉, 黄志超, 田时雨, 颜嵘龙, 邓逸川
    2026, 47(1): 68-77.  DOI: 10.11996/JG.j.2095-302X.2026010068
    HTML    PDF 34     15

    施工现场的组织管理是工程管理的关键环节,但传统的人力监管方法限制多、效率低。近年国家多部委发布有关政策,呼吁促进人工智能与实体经济深度融合,以人工智能推动经济高质高效发展。计算机视觉(CV)技术的准确性、高效性和自动化等优点使CV技术在施工监理领域的应用逐渐广泛,特别是无人机能高效获取复杂多变的施工场景视觉数据的特性显示出其在基于CV技术的施工监管任务中的应用潜力。但当前基于无人机的施工场景目标检测研究有限,且稀缺的无人机视角下的施工场景图像数据集限制着有关研究的深入发展。因此,采用大疆Mavic 3T无人机用于获取施工现场图像,以建立开源的施工场景俯拍图像数据集UB-CSD。选用多种先进目标检测算法在UB-CSD数据集上进行对比实验,从模型流程设计、计算原理和任务场景特性等维度分析各算法性能差异原因。各算法的mAP检测结果为YOLOv8和YOLOv10 (96.1%),YOLOv9 (96.0%),YOLO11 (95.7%),DETR (95.3%),Faster-RCNN (76.3%)和RetinaNet (72.1%)。分析结果表明,YOLO系列算法是基于无人机的施工场景目标检测任务算法的最优选。通过构建全新的开源专用数据集和开展对比实验得出的以上数据及结论,将为建筑业安全生产管理与日后相关检测研究提供有效数据与实验案例。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    基于深度融合多模态特征的三维点云分类小样本类增量学习
    朱晨浠, 卢奕南, 伍铁如, 龚文勇, 马锐
    2026, 47(1): 78-89.  DOI: 10.11996/JG.j.2095-302X.2026010078
    HTML    PDF 27     9

    传统3D点云分类方法在小样本类增量学习(FSCIL)场景下容易出现泛化能力不足和灾难性遗忘等问题。预训练语言-图像模型(CLIP)因具备丰富的2D形状先验知识,被证明能够有效提升3D FSCIL性能,但现有基于CLIP的框架在多模态特征提取与融合过程中仍缺乏灵活性与自适应性,导致增量阶段的分类准确率受限。为解决这些不足,提出了一种深度融合多模态特征的3D FSCIL方法,通过引入基于门控单元与残差块的自适应适配器实现多尺度特征对齐与冗余信息抑制,并设计基于自注意力机制的多模态全局特征动态融合模块,根据不同样本特性自适应调整多路特征的权重分配,从而获得更加一致且互补的融合表示。具体地,将点云渲染为多视角深度图,分别利用原始CLIP视觉编码器与在深度图上预训练的CLIP编码器提取特征,并结合点云几何特征,经自适应适配器处理后送入注意力融合模块,与CLIP文本编码器提取的语义特征对齐进行分类。此外,结合对比学习损失、多视角与几何扰动数据增强策略以及记忆回放机制,有效缓解小样本条件下的过拟合与遗忘问题。在ShapeNet、ModelNet及CO3D数据集上的实验结果表明,与现有主流3D FSCIL方法相比,该方法在各增量阶段均取得更高的准确率,且相对准确度下降率与最大阶段跳变率显著降低。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    一种大视角变换场景下的图像匹配方法
    向梦丽, 黄志勇, 佘雅丽, 丁妥君
    2026, 47(1): 90-98.  DOI: 10.11996/JG.j.2095-302X.2026010090
    HTML    PDF 32     10

    针对现有图像匹配方法在大视角变换场景中匹配精度和匹配数量显著下降的问题,提出了一种改进的E-LoFTR图像匹配方法。首先,采用先视角调整后精细匹配策略,提出了一种新颖的双阶段SIFT视角矫正模块,该模块结合了尺度不变特征变换(SIFT)算法的视角不变性与单应性变换(homography)的几何对齐能力,提高了模型对大视角变换的适应能力。然后,设计了方向感知门控注意力机制,使用多方向卷积和动态门控的级联结构提取查询(Q)、键(K)、值(V),注入的几何先验显著提升了模型的鲁棒性。最后,为了避免特征融合过程中的信息损失问题,使用Fusion-DySample上采样模块提升匹配性能。在公开数据集MegaDepth上的实验结果表明,所提出的方法在旋转误差阈值为5°,10°和20°下的相对位姿估计累计曲线下面积分别为57.1%,72.7%和83.9%,较E-LoFTR分别提升0.7%,0.5%和0.4%;在基于MegaDepth构建的全新数据集NewMega和私有工业数据集上,匹配点对数量和匹配正确率均显著提升。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    BSD-YOLO:基于动态稀疏注意力与自适应检测头的小目标车辆检测方法
    杨彪, 王学, 官铮, 龙萍
    2026, 47(1): 99-110.  DOI: 10.11996/JG.j.2095-302X.2026010099
    HTML    PDF 57     14

    在智能交通监控系统中,复杂场景下的小目标车辆检测面临特征分辨率低、遮挡干扰严重、模型计算冗余及边界框回归精度不足等挑战。为兼顾检测精度与边缘设备部署效率,提出一种基于动态稀疏注意力与轻量化双分支结构的改进YOLOv8检测框架。首先设计双向路由稀疏注意力机制(ReBiAttention),通过双层动态路由筛选关键特征,增强对小目标浅层特征的保留能力;随后结合GSConv与VoV-GSCSP模块,在减小计算量的同时动态调整多尺度特征权重;并在检测头部分引入改进型DynamicHead结构,实现多任务自适应优化;最后改进ShapeIoU损失函数,引入形状与尺度感知机制,提升定位精度。在UA-DETRAC数据集上的实验表明,改进模型较基线YOLOv8n的Precision,Recall与mAP@0.5分别提升8.739%,1.685%和7.225%,参数量减少4.3%。该方法为复杂交通场景下的小目标车辆精准检测提供了高效解决方案。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    基于特征点引导干扰物识别的神经辐射场重建
    任皓, 李少波, 弓茂, 王博
    2026, 47(1): 111-119.  DOI: 10.11996/JG.j.2095-302X.2026010111
    HTML    PDF 29     7

    针对神经辐射场(NeRF)在干扰物体影响下难以实现高质量三维重建的问题,提出一种基于运动恢复结构(SfM)与多视图立体匹配(SAM)模型协同优化的方法。以SfM重建过程中的SIFT算法为基础,利用动态场景中的几何不一致性进行特征点的识别与匹配,将未匹配的特征点视为动态干扰物,进而引导可以接受点引导分割的SAM模型实现动态遮挡物分割,生成静态场景掩膜。基于分割结果,使用掩码感知体积渲染技术预测颜色,并建立四重损失函数:重建损失、结构一致性损失、对抗损失和自监督修补损失。通过联合优化目标的方式约束被修补区域的颜色输出,经多次迭代训练后,实现多视角下被遮挡区域的几何结构与外观的一致性修复,保证辐射场完整性的同时,实现遮挡物的消除。经公开动态场景数据验证表明,利用掩膜体积渲染和联合优化后的重建效果相较于基线模型和主流遮挡物消除方法峰值信噪比(PSNR)平均提升了5.24 dB,感知图像相似度(LPIPS)降低35%,该方法为复杂动态环境下的三维重建提供了新范式。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    基于动态视觉传感器的航发叶片缺陷检测
    张行顺, 陈海永
    2026, 47(1): 120-130.  DOI: 10.11996/JG.j.2095-302X.2026010120
    HTML    PDF 32     9

    航空发动机叶片作为发动机核心零部件,其表面微小缺陷可能导致严重安全事故,传统视觉检测技术受限于运动模糊、动态范围低及背景冗余等问题。针对上述挑战,提出一种基于动态视觉传感器(DVS)的航发叶片缺陷检测方法。动态视觉传感器数据格式为异步事件流,故也被称作事件相机,具有动态范围大、高帧率和微小目标捕捉能力强等优势。首先搭建基于DVS的缺陷检测平台,探索总结了其成像特点及优势。在此基础上,构建首个基于DVS的航发叶片缺陷检测数据集(EDD-AB),涵盖划痕、点痕、边缘损伤3类缺陷近6 000张图像,精细标注近1.2万个目标标签,数据集已开源(链接: https://github.com/NiBieZhouMei5520/EDD-AB.git)。进一步提出基于异步事件流帧聚合的多尺度缺陷检测算法(AEAF-ABDD):通过固定时间窗的帧聚合技术实现事件流可视化;构建多分辨率自适应特征金字塔网络(MRAFPN)增强多尺度缺陷特征提取能力;引入轻量级SimAM注意力机制强化关键区域聚焦;融合星形卷积模块(StarNet)提升高维非线性特征映射效率,实现复杂曲面工件多尺度缺陷的精准检测。实验表明,AEAF-ABDD在EDD-AB数据集上的平均精度均值(mAP)达97.7%,检测速度达105帧/秒,显著优于主流算法,为高反光曲面工件的自动化质检提供了高效解决方案,推动了DVS在工业检测领域的应用。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    基于动态剪枝的跨域小样本图像生成方法研究
    李世亮, 方强, 王屹华, 施逸飞, 王卓, 李泽玉, 谢云飞, 王佳
    2026, 47(1): 131-142.  DOI: 10.11996/JG.j.2095-302X.2026010131
    HTML    PDF 27     12

    小样本图像生成在医学成像、艺术创作等领域具有重要的应用价值。近年来,该任务取得了诸多研究成果,主流方法通常依赖将大规模源域数据集上预训练的生成模型迁移至目标域,以缓解目标数据稀缺带来的训练困难。然而,当源域与目标域之间存在显著语义差异时,直接迁移往往会引入不兼容的源域特征,从而引发生成图像真实性降低与风格一致性减弱等问题。现有方法虽通过静态剪枝(如固定阈值裁剪滤波器)去除冗余特征,但仍难以适应深度网络各层特征表达的动态演化规律,且易造成浅层通用特征被误删、深层冗余特征残留等问题,从而影响模型的迁移效果与生成质量。为此,提出了一种基于滤波器重要性估计的动态剪枝方法。首先,在训练过程中持续跟踪各层滤波器的Fisher信息变化,衡量其对图像生成质量的重要性程度。然后,结合Fisher信息构建了一种基于累积重要性权重的自适应剪枝机制,能够动态确定不同层级的剪枝比例,从而更精准地剔除冗余或不兼容特征的滤波器,保留通用的结构语义信息。实验在多个具有代表性的小样本目标域上进行,结果表明,该方法在生成图像质量指标(FID)和多样性指标(Intra-LPIPS)上显著优于现有方法。其中,在与源域语义相差较大的目标域中该方法FID优于现有最优方法,验证了其在跨域小样本图像生成任务中的稳定性与优越性。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    计算机图形学与虚拟现实
    基于轻量级网络和加权RF的点云分类分割算法
    赵夫群, 郝寒竹, 余佳乐
    2026, 47(1): 143-151.  DOI: 10.11996/JG.j.2095-302X.2026010143
    HTML    PDF 40     9

    针对点云分类分割方法中存在的高计算开销、复杂网络模型等问题,提出一种基于轻量级网络和加权随机森林(RF)的点云分类分割算法。该算法采用层次化的方式实现高效分类分割,首先针对传统神经网络层数多、计算复杂等问题,构造轻量级神经网络,并利用其提取点云的全局形状、区域间关系、曲率、法向量和颜色等特征,实现点云的快速粗分类分割;然后针对数据不平衡的问题,设计自适应分类分割策略,并引入加权RF,结合不一致度量筛选与动态加权优化机制,以实现点云精分类分割。在ModelNet40数据集上进行分类实验,在Semantic3D数据集和室外场景点云数据上进行了分割实验,结果表明,相比Local Geo-Transformer,PointNeXt和FastPointNet++等算法,该算法的分类分割精度分别提高了约1.9%,1.6%和1.7%,分类分割时间分别降低了约40%,30%和20%。由此可见,基于轻量级网络和加权RF的点云分类分割算法在保持较高分类分割精度的同时,可以有效缩短模型的训练时间,提高分类分割效率,是一种有效的点云分类分割算法。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    结合隐式几何编码与Lipschitz线性约束的保守包围盒构造方法
    张冰钰, 况立群, 熊风光, 孙凡淑, 焦世超
    2026, 47(1): 152-161.  DOI: 10.11996/JG.j.2095-302X.2026010152
    HTML    PDF 23     17

    目前主流的包围盒方法在三维场景渲染、光线追踪和碰撞检测等任务中广泛应用,但在拟合复杂几何形状时存在空间利用率低、拟合精度不足等问题,难以确保严格的保守性,并在降低误检率方面仍有改进空间。为解决上述问题,提出一种结合隐式几何编码与Lipschitz约束的保守包围盒构造方法,隐式几何编码通过位置编码将输入坐标映射至高维空间,从而捕捉局部及全局的几何信息,提升包围盒的适应性;随后,引入可训练的Lipschitz线性约束层,动态调整Lipschitz常数以控制梯度变化,并结合Lipschitz正则化损失与动态加权交叉熵损失,在优化边界拟合的同时降低假阳率。实验结果表明,该方法在多个三维模型上均能实现假阴率为0,且相比基准方法,误检率最高降低3.1%,单条光线查询方法提高1.7 ms,为高精度保守包围盒拟合提供了一种高效、稳健的解决方案。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    数字化设计与制造
    考虑粗糙表面的复杂产品装配精度预测研究
    王刚锋, 张寰, 杨英英, 刘一涛, 郭彦云, 岳萍, 孙岩辉
    2026, 47(1): 162-172.  DOI: 10.11996/JG.j.2095-302X.2026010162
    HTML    PDF 34     18

    针对现有复杂产品装配精度预测中未充分考虑粗糙表面对装配精度的影响,导致精度预测不准确及实际装配适用性不足的问题,提出一种考虑粗糙表面的装配精度预测方法。首先,构建装配精度信息模型,表达零件配合特征、几何公差及粗糙度信息,并以此为基础,构建装配精度知识图谱;其次,基于小位移旋量(SDT)理论建立几何公差表示模型,并研究平面零件及柱面零件粗糙表面模拟方法及小位移旋量表达式确定方法;再次,根据装配序列确定装配体偏差传递路径,并构建装配接触有向图,利用雅可比-粗糙表面模型实现装配精度预测。最后,以某型号工程机械曲柄连杆机构为例验证方法可行性,结果表明,该方法可实现装配精度的准确预测并对实际装配具有指导价值。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    基于大模型的生成式数字孪生体建模
    梁生龙, 范秋霞
    2026, 47(1): 173-178.  DOI: 10.11996/JG.j.2095-302X.2026010173
    HTML    PDF 55     15

    针对数字孪生(DT)技术与大模型在工业设计中融合应用的挑战,提出了一种基于生成式大模型的CAD-LDT数字孪生体建模框架。通过构建物理实体模块、智能生成模块和虚拟实体模块的三元架构,创新性地整合多模态数据融合机制与领域知识约束,实现从物理实体描述到参数化CAD模型的自主生成。采用LLaVA-7B和LLaMA-7B作为基础模型,通过LoRA轻量化适配器实现视觉-文本特征的跨模态对齐,并设计约束编码器将几何公差与物理规则转化为结构化JSON对象。为增强空间变换的数学一致性,引入李群算法优化刚体变换表征;采用几何权重分箱方法离散化复杂装配关系;提出时空解耦生成策略,协同规划空间布局与装配时序。在DeepCAD数据集上的实验结果表明,该框架在几何达到83.6%,约束满足率达91.3%,生成效率提升了26.5%,显著优于主流基线模型。消融实验进一步验证了多模态融合、约束编码机制和李群算法对建模质量的关键贡献。为智能制造领域提供了新的DT建模范式,在参数化设计、装配工艺优化等方面展现出工程应用价值。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    基于MBSE的复杂成形装备概念设计方法
    王博雅, 王绍宗, 杨万然, 周兴炜, 侯亮, 熊成悦
    2026, 47(1): 179-193.  DOI: 10.11996/JG.j.2095-302X.2026010179
    HTML    PDF 34     4

    复杂成形装备的传统研制方式通常采用基于文档的系统工程(DBSE)方法开展,存在需求分析不完善导致研发缓慢、文本二义性导致需求覆盖不全、装备进展落后于技术迭代等问题,造成设计出的复杂成形装备存在设计指标不满足使用要求、反复修改致使设计效率低下等问题。因此,在复杂成形装备概念设计阶段,参考美国国防部体系结构框架(DoDAF),结合基于模型的系统工程(MBSE),提出了基于MBSE的复杂成形装备概念设计方法。并以全景、能力、运行、系统及标准共5类视角作为复杂成形装备概念设计的切入点,通过多类视角切入分析开展复杂成形装备顶层需求获取、需求细化分析、功能分析及系统建模共4层级设计,并使用系统建模语言(SysML)建立起11种模型,实现复杂成形装备概念设计阶段的数字化和流程化表达。最后,以超塑成形装备作为典型实例进行设计方法的应用演示。通过实际应用解决了传统设计方式痛点问题,表明了方法对复杂成形装备的正向研制有良好的指导作用。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    建筑与城市信息模型
    基于Revit二次开发的独立基础参数化建模方法研究
    邓鹏, 谭文正, 罗慧明, 李帅, 杨斌
    2026, 47(1): 194-203.  DOI: 10.11996/JG.j.2095-302X.2026010194
    HTML    PDF 49     14

    随着建筑信息模型(BIM)技术在工程设计领域的广泛应用,由Revit平台驱动的三维正向设计在上部结构中已形成了较为成熟的解决方案。然而,独立基础作为结构的重要组成部分,其三维建模与出图仍存在效率低、信息完整性差等问题,且因主流的结构分析软件数据接口封闭,直接提取基础数据库文件的配筋信息并同步至Revit构件属性也极具挑战。为此,利用Revit API与MVVM架构模式,提出了一种基于AutoCAD图层与字段识别的独立基础参数化建模算法。将YJK结构分析软件生成的基础平面布置与配筋标注图导入至Revit平台,通过图层识别方法计算基础中心定位坐标与平面尺寸,再根据基础与配筋标注的相对位置关系,建立两者间的匹配逻辑,进而利用字段识别获取基础对应标注中的编号、高度及配筋信息,并将其自动写入模型的族属性中。此外,通过提取模型属性与几何面参照,还实现了基础尺寸与配筋自动标注等功能。最后,以某冷柜自制厂房为工程案例开展了独立基础参数化建模及出图应用实践,并与常规方法进行了对比。结果表明,该算法能显著提高独立基础三维建模与标注出图效率,且对PKPM软件导出的计算文件具有良好的适配性。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    建造场景动态体素化碰撞检测方法研究
    林昊, 吴志铭, 金季岚
    2026, 47(1): 204-215.  DOI: 10.11996/JG.j.2095-302X.2026010204
    HTML    PDF 59     12

    在建造场景所有安全事故中,碰撞事故被认为是最常见的伤害之一。为能有效预防监测碰撞事故的发生,采用计算机图形分析技术辅助碰撞检测分析,具有一定成效,但在检测的实时性与高精度的平衡上仍存在局限。为了解决这个问题,提出了一种基于动态体素化的碰撞检测方法,即融合空间动态体素树生成与资源动态球状体素化计算,构建了一种碰撞检测分析机制。核心思路在于:①基于拥挤度阈值,递归分割空间生成动态体素树,有效过滤非碰撞风险区域;②依据资源间相对距离和资源体积动态计算体素单元边长,实现体素粒度的自适应调节;③采用球状体素替代传统立方体体素,避免非轴对齐检测的计算负担;④引入空心化处理剔除内部无效体素,进一步优化检测效率。该方法能够在复杂动态建造环境中精准捕捉资源交互,显著提升检测精度并优化计算效率。实验结果表明,相较于传统方法,该方法在检测精度上显著提高,精确率与准确率分别达到94.64%与96.67%。在碰撞检测时间上,比多数现有方法更具效率,计算速度至少提升了11.36%。同时,研究分析了体素树深度、根节点尺寸和体素边长参数对性能的影响,并分析了不同规模场景的CPU资源与内存资源的消耗。消耗量处于可接受范围内,验证了其在建造场景的适用性。该方法为提升建造安全管理智能化水平提供了有效的信息化处理新思路。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    基于图论及改进A*算法的屋面设备检修动线设计智能分析
    何瑞琦, 曹盈, 许璟琳, 余芳强
    2026, 47(1): 216-222.  DOI: 10.11996/JG.j.2095-302X.2026010216
    HTML    PDF 28     6

    在屋面工程设计中,设备检修动线的合理性直接影响检修效率与安全性,传统设计方法常依赖经验判断,难以在设计阶段充分评估动线设计的合理性。针对此问题,提出了一种基于图论及改进A*算法结合的混合算法,并结合建筑信息模型(BIM)技术,开发了一种基于该算法的屋面设备检修动线智能分析设计工具,通过数字化模型进行动线分析,弥补传统设计的不足。首先,采用碰撞检测与八叉树算法将屋面转化为带有权重的等效网格图;然后采用改进A*算法优化检修路径,综合考虑设备碰撞体积和空间限制,计算最优检修动线并评估动线区域深化设计合理性;最后,使用以该算法为基础的检修动线智能分析设计工具对实际项目进行实验。实验结果表明,该算法不仅能够精准揭示设计中可能存在的空间冲突和不合理布局,为优化设计提供数据支持,提高了设计的合理性和可操作性,且比传统人工设计效率提高了5倍以上。目前基于该算法的智能分析工具已在上海建工四建集团的多项实际项目中使用。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    工业设计
    机器人如何吸引儿童?外观、动作和声音多感官特征在早期互动中的作用
    李奕, 曹成才, 宋章通, 李祚奇, 黎晓, 李和森
    2026, 47(1): 223-233.  DOI: 10.11996/JG.j.2095-302X.2026010223
    HTML    PDF 44     14

    随着人工智能技术的快速发展,多模态机器人在学前儿童的教育、娱乐及日常生活中扮演着日益重要的角色。现有研究多关注机器人单一感官线索对儿童感知的作用,但关于多感官整合效应仍缺乏系统性研究。为探究机器人多模态特征如何共同影响儿童的情感偏好和视觉注意力,招募318名4~6岁儿童参与1项眼动追踪实验。实验采用2(外观特征:拟人型、拟动物型)×3(声音引导:男声、女声、无)×2(手势引导:有、无)的三因素混合实验设计,以机器人外观特征(拟人型与拟动物型)和行为特征(声音、手势引导)为自变量,以儿童情感偏好和眼动指标为因变量,系统考察了多感官特征对儿童用户的影响。结果表明,在外观特征方面,拟人型机器人和拟动物型机器人在主观偏好评分上没有显著差异,但拟人型机器人吸引了更长的总注视时长、更多的注视次数和更短的首次注视时间,拟人型机器人在注意力指标上显著优于拟动物型机器人,儿童在视觉接触的初始阶段更容易被拟人型机器人所吸引,且拟人化设计在持续吸引儿童注意力方面更具优势。在行为特征方面,具有手势引导的机器人在主观偏好评分上显著高于无手势机器人,且吸引了更长的总注视时长和更多的注视次数。女声机器人在主观偏好评分上略高于男声,且两者均显著高于无声机器人。男声机器人在总注视时长上略高于女声,且两者均显著高于无声机器人。而女声和男声机器人在注视次数的差异不显著,但两者均显著高于无声机器人。具有手势引导和声音(尤其是女声)的机器人在主观评分和视觉注意力分配上表现更好,说明行为特征在增强儿童的情感偏好和互动体验中具有重要作用。此外,外观和行为特征对儿童情感偏好和视觉注意力的影响相对独立,未观察到显著交互作用。该研究揭示了机器人外观和行为特征对学前儿童情感偏好和视觉注意力的影响机制,为设计满足用户情感偏好的儿童机器人提供了科学依据。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    本期样刊
    2026年第1期样刊
    2026, 47(1): 234. 
    PDF 13     6
    相关文章 | 计量指标