Please wait a minute...
欢迎访问《图学学报》 分享到:

过刊目录

    全选选: 隐藏/显示图片
    封面
    2023年第1期封面
    2023, 44(1): 0-0. 
    摘要 ( 288 )   PDF(1586KB) ( 296 )  
    相关文章 | 计量指标
    目次
    2023年第1期目次
    2023, 44(1): 1. 
    摘要 ( 148 )   PDF(214KB) ( 107 )  
    相关文章 | 计量指标
    综述
    基于深度学习的图像超分辨率研究综述
    李洪安, 郑峭雪, 陶若霖, 张敏, 李占利, 康宝生
    2023, 44(1): 1-15.  DOI: 10.11996/JG.j.2095-302X.2023010001
    摘要 ( 713 )   HTML ( 26 )   PDF(3973KB) ( 411 )  

    超分辨率(SR)是一类重要的数字图像处理技术,其根据一个观测者得到的低分辨率(LR)图像重建并输出一个相应的高分辨率(HR)图像,从而提高现代数字图像的分辨率。SR在数字图像压缩与传输、医学成像、遥感成像、视频感知与监控等学科中的研究与应用价值巨大。随着深度学习的快速发展,结合最新的深度学习方法,可以为SR问题提供创新性的解决方案。首先回顾SR的背景意义、发展过程以及将深度学习应用于SR的技术价值。其次简要介绍传统SR算法的基本方法、分类和优缺点;按照不同的实现技术和网络类型对基于深度学习的SR方法进行了分类介绍,重点分析对比了卷积神经网络(CNN)、残差网络(ResNet)和生成对抗网络(GAN)在SR中的应用。然后介绍主要评价指标和解决策略,并对不同的SR算法在标准数据集中的性能表现进行对比。最后总结基于深度学习的SR算法,并对未来发展趋势进行展望。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    图像处理与计算机视觉
    融合注意力机制的YOLOv5口罩检测算法
    李小波, 李阳贵, 郭宁, 范震
    2023, 44(1): 16-25.  DOI: 10.11996/JG.j.2095-302X.2023010016
    摘要 ( 479 )   HTML ( 6 )   PDF(10477KB) ( 439 )  

    新冠疫情期间正确佩戴口罩可以有效防止病毒的传播,针对公共场所存在的人员密集、检测目标较小等加大检测难度的问题,提出一种以YOLOv5s模型为基础并引入注意力机制融合多尺度注意力权重的口罩佩戴检测算法。在YOLOv5s模型的骨干网络中分别引入4种注意力机制,抑制无关信息,增强特征图的信息表达能力,提高模型对小尺度目标的检测能力。实验结果表明,引入CBAM模块后较原网络mAP值提升了6.9个百分点,在4种注意力机制中提升幅度最明显,而引入NAM模块后在损失少量mAP的情况下使参数量最少,最后通过对比实验选用GIoU损失函数计算边界框回归损失,进一步提升定位精度,最终结果较原网络mAP值提升了8.5个百分点。改进模型在不同场景下的检测结果证明了该算法对小目标检测的准确率和实用性。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    基于YOLOv5s的轻量化森林火灾检测算法研究
    皮骏, 刘宇恒, 李久昊
    2023, 44(1): 26-32.  DOI: 10.11996/JG.j.2095-302X.2023010026
    摘要 ( 556 )   HTML ( 7 )   PDF(1809KB) ( 257 )  

    针对过去无人机搭载嵌入式设备巡检森林火灾精确率低、适应性差和软硬件限制高等问题,提出一种基于YOLOv5s的轻量化森林火灾目标检测算法。通过将YOLOv5s的骨干网络替换为轻量化网络Shufflenetv2,并以通道重组的思想,让骨干网络对图片信息的提取效率变得更快,在保持网络精度的同时保证检测速度;接着在Backbone与Neck的连接处加入为轻量化网络设计的CA位置注意力模块,可将图片不同的位置信息聚合到通道中,使被检对象关注度得以提高;最后在预测部分使用CIOU损失函数,能够更好的优化矩形框的长宽比和更快加速模型收敛。算法部署在嵌入式系统Jetson Xavier NX上的结果显示,改进后的网络模型大小与对比实验方法相比,最多减少了98%,准确率(Precision)达到92.6%,精确率(AP)达到95.3%,帧率(FPS)提升到132帧每秒,能满足在白天、黑夜或视野良好等情况下对森林火灾的实时性预防与检测,并具有良好的准确率和鲁棒性。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    基于残差增强注意力的跨模态行人重识别
    邵文斌, 刘玉杰, 孙晓瑞, 李宗民
    2023, 44(1): 33-40.  DOI: 10.11996/JG.j.2095-302X.2023010033
    摘要 ( 157 )   HTML ( 1 )   PDF(2773KB) ( 98 )  

    跨模态行人重识别主要面临2个问题:①成像机制不同所导致的红外图像和可见光图像之间的模态差异;②图像特征的身份判别性不足导致的类内差异。针对上述2个问题,基于残差增强注意力的跨模态行人重识别方法被提出用来提高行人特征的模态不变性和身份判别性。首先,设计网络浅层参数独立、网络深层参数共享的双路卷积神经网络作为骨干网络。然后,分析现有注意力机制存在的全局弱化,设计了残差增强注意力方法解决该问题,提升注意力机制的性能,将其分别应用在网络浅层的通道维度和深层的空间位置上,提升模型对于模态差异的消除能力和行人特征的身份鉴别能力。在SYSU-MM01和RegDB 2个数据集上进行的实验证明了该方法的先进性,大量的对比实验也充分证明本文方法的有效性。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    基于多尺度特征融合的细胞计数方法
    张倩, 王夏黎, 王炜昊, 武历展, 李超
    2023, 44(1): 41-49.  DOI: 10.11996/JG.j.2095-302X.2023010041
    摘要 ( 119 )   HTML ( 3 )   PDF(3866KB) ( 87 )  

    细胞计数一直是医学影像分析中非常重要的一项工作,在生物医学实验和临床医学等领域起着十分关键的作用。针对细胞计数工作中存在的由细胞尺寸变化等因素造成的细胞计数精度低的问题,引入高度拥挤目标识别网络CSRNet并加以改进,构建了一种基于多尺度特征融合的细胞计数方法。首先,使用VGG16的前10层提取细胞特征,避免了由于网络过深造成的小目标信息丢失;其次,引入空间金字塔池化结构提取细胞的多尺度特征并进行特征融合,降低了因细胞形态各异、尺寸不一和细胞遮挡等问题带来的计数误差;然后,使用混合空洞卷积对特征图进行解码,得到密度图,解决了CSRNet在解码过程中像素遗漏的问题;最后对密度图逐像素进行回归得到细胞总数。另外,在训练过程中引入了一种新的组合损失函数以代替欧几里得损失函数,不仅考虑了ground truth密度图与预测密度图单个像素点之间的关系,还考虑了其全局和局部的密度水平。实验证明,优化后的CSRNet在VGG cells和MBM cells数据集上取得了较好的结果,有效改善了由细胞尺寸变化等因素造成的细胞计数精度低的问题。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    融合注意力机制的肠道息肉分割多尺度卷积神经网络
    单芳湄, 王梦文, 李敏
    2023, 44(1): 50-58.  DOI: 10.11996/JG.j.2095-302X.2023010050
    摘要 ( 140 )   HTML ( 3 )   PDF(1022KB) ( 111 )  

    肠道息肉分割能够提供息肉在结肠中的位置和形态信息,方便医生依据其结构变化程度来推断癌变可能性,有利于结肠癌的早期诊断和治疗。针对许多现有的卷积神经网络所提取的多尺度特征有限,且常引入冗余和干扰特征,难以应对复杂多变的肠道息肉分割问题,提出了一种融合注意力机制的肠道息肉分割多尺度卷积神经网络(CNN)。首先,设计不同比例金字塔池化策略提取丰富的多尺度上下文信息;然后,通过在网络中融入通道注意力机制,模型能够根据目标自适应地选择合适的局部上下文信息和全局上下文信息进行特征集成;最后,联合金字塔池化策略和通道注意力机制构建多尺度有效语义融合解码网络,增强模型对形状、大小复杂多变的肠道息肉分割的鲁棒性。实验结果表明,本文模型分割的Dice系数、IoU和灵敏度在CVC-ClinicDB数据集上分别为90.6%,84.4%和91.1%,在ETIS-Larib数据集上分别为80.6%,72.6%和79.0%,其能够从肠镜图像中准确、有效地分割出肠道息肉。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    基于注意力机制的东巴画情感分类
    潘森垒, 钱文华, 曹进德, 徐丹
    2023, 44(1): 59-66.  DOI: 10.11996/JG.j.2095-302X.2023010059
    摘要 ( 99 )   HTML ( 1 )   PDF(3412KB) ( 98 )  

    东巴画情感多元、样本较少,基于注意力机制的分类算法能有效辅助东巴画情感分类,解决东巴画样本较少的问题。首先,按照绘画主题,将东巴画分为人物、鬼怪、动物、植物4类题材,按照绘画情感分为勤劳朴实、曼妙美好等12种情感;其次,采用编码器-解码器架构实现东巴画的情感特征提取,引入预训练模型提升分类模型的泛化性能,加速小样本东巴画情感分类收敛;最后,在解码器中设置空白注意力并融合编码器的输出序列,经由解码器的解码学习机制,学习东巴画图像语义以指导模型更准确、合理地提升对东巴画情感的学习能力。实验结果表明,基于注意力机制的分类算法相较现有方法分类准确率更高,获得了80.7%的分类准确率,解决了东巴画情感丰富、难以区分的问题。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    草图引导的选择循环推理式人脸图像修复网络
    邵英杰, 尹辉, 谢颖, 黄华
    2023, 44(1): 67-76.  DOI: 10.11996/JG.j.2095-302X.2023010067
    摘要 ( 94 )   HTML ( 2 )   PDF(10398KB) ( 86 )  

    图像修复在修复老照片、消除人脸马赛克等应用中起到关键作用。针对现有深度学习人脸图像修复方法因受干扰信息影响,存在编解码器修复效果欠佳,修复结果因概率多样性出现偏离用户预期等问题。提出了一种草图引导的选择循环推理式人脸图像修复网络,通过设计一种选择循环推理策略,在循环网络中引入选择机制降低干扰信息对编解码的推理影响,并在编码器和解码器之间的跳跃连接中加入基于草图的结构信息修正模块,从而限制修复结果相对于用户期望的结构偏离。在CelebA-HQ数据集上的实验结果表明,该方法在评价指标和引导生成用户期望内容方面均优于其他经典网络。在人工手绘草图上的实验结果表明,可以通过简单的手绘方式生成用户指定的内容,具有一定的实际应用意义。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    基于分数阶小波与引导滤波的多聚焦图像融合方法
    张晨阳, 曹艳华, 杨晓忠
    2023, 44(1): 77-87.  DOI: 10.11996/JG.j.2095-302X.2023010077
    摘要 ( 77 )   HTML ( 2 )   PDF(3990KB) ( 60 )  

    针对多聚焦图像融合中存在易丢失细节信息、图像边缘处产生伪影等问题,提出了一种基于离散分数阶小波变换(DFRWT)结合引导滤波的多聚焦图像融合新方法。首先,采用DFRWT将多聚焦源图像进行多尺度分解,得到低频部分与高频部分。其次,为了使图像信息有效地融合,根据小波模系数的能量在不同阶数下的分布特征,选取最适合分数阶阶数,在低频部分应用拉普拉斯能量并获得初始决策,再用引导滤波修正决策图得到融合规则;高频部分采用分数阶空间频率的融合规则。最后,通过DFRWT逆变换获得融合后的图像。新方法与现有5种算法进行视觉对比和定量评估,仿真实验表明,本文方法有效抑制了Gibbs效应和边缘处的伪影效应,视觉效果和客观评价均令人满意,融合图像的质量优于已有的几类经典算法。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    列车闸瓦钎及闸瓦故障图像检测算法研究
    谷雨, 赵军
    2023, 44(1): 88-94.  DOI: 10.11996/JG.j.2095-302X.2023010088
    摘要 ( 49 )   HTML ( 1 )   PDF(1720KB) ( 48 )  

    列车闸瓦钎及闸瓦状态正常与否对于货运列车安全运行极其重要,为此提出了一种改进的SSD目标检测算法,对货运列车闸瓦钎及闸瓦的缺失进行检测。首先将深度可分离卷积模块引入ResNet50网络模型,使其参数数量减少约50%,以提高检测效率。其次,将改进后的ResNet50网络模型替换SSD中的VGG16网络,以改善SSD网络模型的特征提取能力。然后利用高、低层特征融合的方法,将网络中Conv5_3和Conv7_2分别与Conv4_6和Conv6_2进行特征融合,提高检测精度。最后通过自建的货运列车制动部件缺失数据集对网络进行训练获取比较准确的网络权重。实验结果表明,改进后的SSD算法在闸瓦钎丢失检测中准确率达到96.85%,召回率达到89.50%;在闸瓦丢失检测中准确率达到97.01%,召回率达到97.01%,可以满足列车闸瓦钎及闸瓦缺失检测需求。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    融合行人时空信息的视频异常检测
    闫善武, 肖洪兵, 王瑜, 孙梅
    2023, 44(1): 95-103.  DOI: 10.11996/JG.j.2095-302X.2023010095
    摘要 ( 98 )   HTML ( 5 )   PDF(1567KB) ( 71 )  

    针对目前视频异常检测不能充分利用时序信息且忽视正常行为多样性的问题,提出了一种融合行人时空信息的异常检测方法。以卷积自编码器为基础,通过其中的编码器和解码器对输入帧进行压缩和还原,并根据输出帧与真实值的差异实现异常检测。为了加强视频连续帧之间的特征信息联系,引入残差时间移位模块和残差通道注意力模块,分别提升网络对时间信息和通道信息的建模能力。考虑到卷积神经网络(CNN)过度的泛化性,在编解码器各层的跳跃连接之间加入记忆增强模块,限制自编码器对异常帧过于强大的表示能力,提高网络的异常检测精度。此外,通过一种特征离散性损失来修正目标函数,有效区分不同的正常行为模式。在CUHK Avenue和ShanghaiTech数据集上的实验结果表明,该方法在满足实时性要求的同时,优于当前主流的视频异常检测方法。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    一种用于视频对象分割的仿U形网络
    黄志勇, 韩莎莎, 陈致君, 姚玉, 熊彪, 马凯
    2023, 44(1): 104-111.  DOI: 10.11996/JG.j.2095-302X.2023010104
    摘要 ( 90 )   HTML ( 2 )   PDF(2955KB) ( 47 )  

    在半监督的分割任务中,单镜头视频对象分割(OSVOS)方法根据第一帧的对象标记掩模进行引导,从视频画面中分离出后续帧中的前景对象。虽然取得了令人印象深刻的分割结果,但其不适用于前景对象外观变化显著或前景对象与背景外观相似的情形。针对这些问题,提出一种用于视频对象分割的仿U形网络结构。将注意力机制加入到此网络的编码器和解码器之间,以便在特征图之间建立关联来产生全局语义信息。同时,优化损失函数,进一步解决了类别间的不平衡问题,提高了模型的鲁棒性。此外,还将多尺度预测与全连接条件随机场(FC/Dense CRF)结合,提高了分割结果边缘的平滑度。在具有挑战性的DAVIS 2016数据集上进行了大量实验,此方法与其他最先进方法相比获得了具有竞争力的分割结果。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    计算机图形学与虚拟现实
    PointMLP-FD:基于多级自适应下采样的点云分类模型
    梁奥, 李峙含, 花海洋
    2023, 44(1): 112-119.  DOI: 10.11996/JG.j.2095-302X.2023010112
    摘要 ( 149 )   HTML ( 2 )   PDF(2280KB) ( 107 )  

    针对受硬件条件、物体遮挡和背景杂波等客观因素的影响,传感器采集的目标点云具有较强的稀疏性和密度不均匀性,导致分类模型对点云特征的学习效率低、分类泛化能力差的问题,提出了一种基于多级自适应下采样的点云分类模型PointMLP-FD。该模型设计了多个MLP模块作为网络分支,以点云的浅层特征为输入得到每个点云类别维度上的特征表达,之后再根据特征表达进行排序,选择具有更强语义特征的点构成下采样点集。通过过滤背景和与目标相关性低的信息来自适应保留反应目标本质特征的信息。最后分别计算分支网络的损失,与骨干网络并行训练来优化点云特征,减少模型参数。该方法在ScanObjectNN数据集上进行测试,结果表明相较于PointMLP-elite分类精度更高,mAcc提升1%,OA提升0.8%,以更少的参数量接近SOTA模型的性能。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    CTH-Net:从线稿和颜色点生成服装图像的CNN-Transformer混合网络
    潘东辉, 金映含, 孙旭, 刘玉生, 张东亮
    2023, 44(1): 120-130.  DOI: 10.11996/JG.j.2095-302X.2023010120
    摘要 ( 123 )   HTML ( 5 )   PDF(5602KB) ( 76 )  

    绘制服装效果图是服装设计过程中重要的一环,针对目前存在智能化程度不足、对用户绘画水平和想象能力要求较高等问题,提出了一种使用线稿和颜色点生成服装图像的CNN-Transformer混合网络CTH-Net。CTH-Net结合卷积神经网络(CNN)在提取局部信息和Transformer在处理长距离依赖方面的优势,将2个模型架构进行高效混合,并设计ToPatch和ToFeatureMap模块减小输入Transformer的数据量和维度以降低计算资源消耗。CTH-Net由3个阶段组成:一是草图阶段,旨在预测服装的颜色分布,获得没有渐变和阴影的水彩式图像;二是细化阶段,将水彩式图像细化为有光影效果的服装图像;三是调优阶段,组合一、二阶段的输出进一步优化生成质量。实验结果表明,仅需输入线稿和少量颜色点,CTH-Net便能生成出高质量的服装图像。与现有的方法相比,该网络生成图像的真实感和准确性均有较大优势。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    考虑法向离群的自适应双边滤波点云平滑及IMLS评价方法
    陈亚超, 樊彦国, 禹定峰, 樊博文
    2023, 44(1): 131-138.  DOI: 10.11996/JG.j.2095-302X.2023010131
    摘要 ( 98 )   HTML ( 5 )   PDF(3718KB) ( 52 )  

    针对目前在点云双边滤波平滑算法中,人工输入不合理参数导致的点云平滑效果不佳,且易导致体积收缩及现有去噪后点云质量评价方法存在表达局限性等问题,提出一种自适应参数的点云双边滤波算法和基于隐性移动最小二乘(IMLS)的质量评价方法。首先构建KD-tree数据结构用于点云拓扑,之后搜索各点邻域,利用奇异值分解法计算法向量信息,并在双边滤波公式中引入法向离群因子以剔除邻域内离群点,然后通过扩展高斯核函数的权值计算式,在点云邻域内自适应获取空间与法向特征参数,最后应用改进模型进行点云平滑并引入IMLS方法评价点云质量。实验结果表明,考虑法向离群的自适应双边滤波点云平滑算法具有良好的去噪效果,相比其他算法体积收缩更小,且IMLS评价方法客观有效。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    一种基于Transformer的三维人体姿态估计方法
    王玉萍, 曾毅, 李胜辉, 张磊
    2023, 44(1): 139-145.  DOI: 10.11996/JG.j.2095-302X.2023010139
    摘要 ( 226 )   HTML ( 4 )   PDF(1089KB) ( 160 )  

    三维人体姿态估计是人类行为理解的基础,但是预测出合理的三维人体姿态序列仍然是具有挑战性的问题。为了解决这个问题,提出一种基于Transformer的三维人体姿态估计方法,利用多层长短期记忆(LSTM)单元和多尺度Transformer结构增强人体姿态序列预测的准确性。首先,设计基于时间序列的生成器,通过ResNet预训练神经网络提取图像特征;其次,采用多层LSTM单元学习时间连续性的图像序列中人体姿态之间的关系,输出合理的SMPL人体参数模型序列;最后,构建基于多尺度Transformer的判别器,利用多尺度Transformer结构对多个分割粒度进行细节特征学习,尤其是Transformer block对相对位置进行编码增强局部特征学习能力。实验结果表明,该方法相对于VIBE方法具有更好地预测精度,在3DPW数据集上比VIBE的平均(每)关节位置误差(MPJPE)低了7.5%;在MP-INF-3DHP数据集上比VIBE的MPJPE降低了1.8%。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    保特征的点云骨架提取算法
    王佳栋, 曹娟, 陈中贵
    2023, 44(1): 146-157.  DOI: 10.11996/JG.j.2095-302X.2023010146
    摘要 ( 115 )   HTML ( 5 )   PDF(2657KB) ( 91 )  

    三维模型的骨架提取是计算机图形学中一个重要的研究方向。对于有噪声的点云模型,曲线骨架提取的难点在于保持正确的拓扑结构以及良好的中心性;对于无噪声的点云模型,曲线骨架提取的难点在于对模型细节特征的保留。目前主流的点云骨架提取方法往往无法同时解决这2个难点。算法在最优传输理论的基础之上结合聚类的思想,将点云骨架提取的问题转化为一个最优化问题。首先使用最优传输得到原始点云与采样点云之间的传输计划。然后使用聚类的思想将原始点云进行分割,采样点即成为了簇的中心。接着通过簇与簇之间的调整与合并减少聚类个数,优化聚类结果。最后通过迭代的方式得到粗糙的骨架并使用插点操作进行优化。大量实验结果表明,该算法在有噪声与无噪声的三维点云模型上均能提取出质量良好的曲线骨架并保留模型的特征。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    基于边长的三维形状插值
    刘振晔, 陈仁杰, 刘利刚
    2023, 44(1): 158-165.  DOI: 10.11996/JG.j.2095-302X.2023010158
    摘要 ( 73 )   HTML ( 3 )   PDF(2890KB) ( 80 )  

    形状插值在计算机图形学和几何处理中是一个极其重要而基础的问题,在计算机动画等领域有着广泛应用。注意到在平面三角网格和三维四面体网格插值问题中,对边长平方插值等价于对回拉度量进行插值,因此具有等距扭曲和共形扭曲同时有界的良好性质。通过将其推广至曲面三角网格,提出了一种完全基于边长的曲面三角网格插值算法。给定边长,在重建网格阶段,使用牛顿法对边长误差能量进行优化。并且给出了其海森矩阵的解析正定化形式,从而避免了高代价的特征值分解步骤。注意到四面体网格的边长平方插值结果具有极低曲率,意味着只需少许修改即可将其压平从而嵌入三维空间。因此提出先将曲面三角网格四面体化,再从四面体网格的插值结果提取表面。然后将这表面作为初始化用于边长误差能量的牛顿迭代,从而使得收敛结果更加接近全局最优。在一系列三角网格上进行了实验,结果说明了本文方法比之前方法的边长误差更小,且得到的结果还是有界扭曲的。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    一种对光照和遮挡鲁棒的单应性估计方法
    范震, 刘晓静, 李小波, 崔亚超
    2023, 44(1): 166-176.  DOI: 10.11996/JG.j.2095-302X.2023010166
    摘要 ( 67 )   HTML ( 1 )   PDF(3274KB) ( 63 )  

    单应性估计是计算机视觉领域中的一项基本任务。为了提高单应性估计对光照和遮挡的鲁棒性,提出了一个基于无监督学习的单应性估计模型,该模型以2幅堆叠的图像为输入,以估计所得单应矩阵为输出。提出双向单应性估计平均光度损失;然后,为了增加感受野和提高网络模型对形变、位置变化等的抗性,为网络模型引入空间转换网络(STN)模块和变形卷积;最后,通过插入随机遮挡形状,首次将遮挡因素引入单应性估计任务的合成数据集,使训练出的模型对遮挡具有鲁棒性。与传统方法相比,该方法保持了相当或更好的准确性,且在估计低纹理或光照变化大的图像对的单应性时表现更好;与基于学习的单应性估计方法相比,该方法对遮挡具有鲁棒性,且在真实数据集上具有更好的表现。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    建筑与城市信息模型
    基于改进Mask R-CNN深度学习算法的隧道裂缝智能检测方法
    朱磊, 李东彪, 闫星志, 刘向阳, 沈才华
    2023, 44(1): 177-183.  DOI: 10.11996/JG.j.2095-302X.2023010177
    摘要 ( 230 )   HTML ( 3 )   PDF(1361KB) ( 192 )  

    隧道裂缝检测是避免隧道重大灾害和日常养护的重要工作,但传统人工检测工作量巨大,无法满足实际需求。采用深度学习神经网络Mask R-CNN模型对裂缝进行智能自动检测,避免了人工检测的耗时耗力。通过调整算法参数,优化模型检测结果,获得适用于隧道裂缝检测的Mask R-CNN模型。针对自动识别的裂缝结果,进一步计算其几何特征参数。为充分利用裂缝狭长弯曲特性,体现裂缝走向及基本形态,提出了基于骨架提取和函数拟合思想的裂缝几何特征计算方法。根据裂缝骨架,可获得裂缝走势,计算裂缝长度。通过函数拟合,可得到贯穿裂缝狭长区域的函数,根据函数法向量计算宽度。根据裂缝几何参数计算结果,结合规范规定的须修复裂纹宽度要求,可实现隧道裂缝检测自动预警,为隧道裂缝自动检测提供了技术支撑。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    工业设计
    融合DE-GWO与SVR的文化意象预测模型
    裴卉宁, 邵星辰, 谭昭芸, 黄雪芹, 白仲航
    2023, 44(1): 184-193.  DOI: 10.11996/JG.j.2095-302X.2023010184
    摘要 ( 69 )   HTML ( 1 )   PDF(799KB) ( 67 )  

    为更客观准确的量化文化特征与意象间的关系,提出一种融合混合灰狼优化算法(DE-GWO)与支持向量回归(SVR) 的文化意象预测模型。首先,构建以多组意象词汇为基础的响堂山石窟造像的文化特征的意象空间,并利用眼动追踪技术进行文化意象认知实验,获取被试生理认知数据并对其进行单因素方差分析,进而得到文化意象预测模型的眼动指标参数数据集;其次,引入基于DE算法的差分进化策略以弥补GWO搜索过程陷入停滞状态的问题;再次,利用改进后的GWO算法对SVR模型的参数Cg进行寻优;最后利用构建的DE-GWO-SVR模型实现对文化意象认知的预测。为了进一步证明所构建模型的泛化性,采用BP,ABC-SVR和DT等5种模型进行对比实验,结果表明该模型对于文化意象认知的预测效果更好。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    工程图学
    计算时代工程图学之定位与建设思考
    于海燕, 刘衍聪, 何援军
    2023, 44(1): 194-198.  DOI: 10.11996/JG.j.2095-302X.2023010194
    摘要 ( 112 )   HTML ( 1 )   PDF(1766KB) ( 147 )  

    在2次《图学学科发展报告》基础上,专门讨论工程图学科学与学科的继承问题,探讨其在计算时代的定位与发展。梳理工程图学及画法几何的理论、方法和技术,揭示工程图学无歧义表达、完成工程计算中所隐含的严密理论及科学价值。剖析在计算时代工程图学呈现和渗透到计算机图形学的某些新形态。分析这2大图学分支的共性,特别是两者在图形思维和计算思维上对CAD的支撑作用。以此共性基础为核心,以工程应用为导向,以科学研究与人才培养为目标,探索建立多元思维融合的工程图学学科建设框架。

    数据和表 | 参考文献 | 相关文章 | 计量指标
    本期样刊
    2023年第1期样刊
    2023, 44(1): 199. 
    摘要 ( 38 )   PDF(68251KB) ( 76 )  
    相关文章 | 计量指标
    本期参考文献引用格式
    2023年第1期22篇参考文献
    2023, 44(1): 200. 
    摘要 ( 14 )   PDF(155KB) ( 5 )  
    相关文章 | 计量指标