Please wait a minute...
欢迎访问《图学学报》 分享到:

过刊目录

    全选选: 隐藏/显示图片
    封面
    2022年第2期封面
    2022, 43(2): 0. 
    摘要 ( 149 )   PDF(1588KB) ( 137 )  
    相关文章 | 计量指标
    目次
    2022年第2期目次
    2022, 43(2): 1. 
    摘要 ( 120 )   PDF(211KB) ( 60 )  
    目   
    综述
    音频驱动跨模态视觉生成算法综述 ···························· 姜 莱, 于 震, 王鹏飞, 周东生, 侯亚庆 (181)
    图像处理与计算机视觉
    基于深度学习的公共建筑像素施工图空间识别 ························ 高 铭, 张荷花, 张庭瑞, 张轩铭 (189)
    基于遥感图像的多模态小目标检测 ·················································· 胡 俊, 顾晶晶, 王秋红 (197)
    基于改进像素相关性模型的图像分割算法 ····················· 张 燕, 高 鑫, 刘 以, 张小峰, 张彩明 (205)
    基于分层压缩激励的 ASPP 网络单目深度估计 ························ 廖志伟, 金 兢, 张超凡, 杨学志 (214)
    用于视频异常检测的时序多尺度自编码器·········· 吕 浩, 易鹏飞, 刘 瑞, 周东生,张 强, 魏小鹏 (223)
    深度可分离卷积和标准卷积相结合的高效行人检测器··· 张运波, 易鹏飞, 周东生, 张 强, 魏小鹏 (230)
    基于轻量级网络的人脸检测及嵌入式实现······· 张 明, 张芳慧, 宗佳平, 宋 治, 岑翼刚, 张琳娜 (239)
    基于深度学习的人物肖像全自动抠图算法 ··················································· 苏常保, 龚世才 (247)
    基于 DOCT 和 SURF 的立体图像零水印算法 ·················································· 韩绍程, 张 鹏 (254)
    基于边缘熵和局部 FT 分布的超声图像分割模型 ······· 崔文超, 徐德伟, 孙水发, 潘志红, 王习东 (263)
    融合边缘增强注意力机制和 U-Net 网络的医学图像分割 ························· 李翠云, 白 静, 郑 凉 (273)
    基于多维匹配距离融合的指节纹识别 ···································· 黄 杰, 魏 欣, 杨子元, 闵卫东 (279)
    基于透视降采样和神经网络的地面标志检测 ······························ 李玉珍, 陈 辉, 王 杰, 荣 文 (288)

    一种优化 YOLO 模型的交通警察目标检测方法

        ··················································· 李妮妮, 王夏黎, 付阳阳, 郑凤仙, 何丹丹, 袁绍欣 (296)

    计算机图形学与虚拟现实
    民机飞行机组应急逃生设计混合现实仿真系统 ······················· 吴程程, 吕 毅, 袁新浩, 许澍虹 (306)
    两阶段可调节感知蒸馏网络的虚拟试衣方法 ·························· 陈宝玉, 张 怡, 于冰冰, 刘秀平 (316)
    基于道钉中心点定位的几何特征扣件定位算法 ························· 曹义亲, 易 湖, 邱 沂, 周一纬 (324)
    基于全局姿态感知的轻量级人体姿态估计 ···························· 刘玉杰, 张敏杰, 李宗民, 李 华 (333)
    熔丝制造的三维连续编织填充图案 ······································ 吴焕晓, 姚 远, 杨金秀, 丁 成 (342)
    工业设计
    汉字字体笔画形态与情感意象的关系模型 ··········· 欧阳晋焱, 高旋涵, 张书涛, 王旭红, 周爱民 (348)
    智能汽车座舱人机交互任务复杂度分析方法 ················································· 马 宁, 王亚辉 (356)
    相关文章 | 计量指标
    综述
    音频驱动跨模态视觉生成算法综述
    姜莱, 于震, 王鹏飞, 周东生, 侯亚庆
    2022, 43(2): 181-188.  DOI: 10.11996/JG.j.2095-302X.2022020181
    摘要 ( 408 )   PDF(1074KB) ( 242 )  
    由于音频驱动的跨模态视觉生成算法具有广泛地应用场景,近年来已得到产业界和科研界的广泛关注。音频和视觉为人们日常生活中最重要和常见的 2 种模态,然而设计一种能够创意地想象出与音频相对应的视觉场景一直是一个巨大挑战,目前关于音频驱动的跨模态视觉生成问题在已有文献中尚未得到系统而全面地研究。针对现有音频驱动的跨模态视觉生成算法进行概述,并将其分为音频到图像、音频到肢体动作视频和音频到说话人脸视频 3 类。首先阐述其具体应用领域与主流算法流程,并对涉及框架技术进行解析,然后按照技术推进的顺序对相关算法的核心内容与优劣势进行阐述,并解释其生成表现效果,最后对目前领域内所面临的机遇和挑战进行讨论,给出未来研究方向。
    相关文章 | 计量指标
    图像处理与计算机视觉
    基于深度学习的公共建筑像素施工图空间识别
    高铭, 张荷花, 张庭瑞, 张轩铭
    2022, 43(2): 189-196.  DOI: 10.11996/JG.j.2095-302X.2022020189
    摘要 ( 411 )   PDF(1332KB) ( 340 )  
    像素级图纸空间识别在自动审图、图纸翻模应用中起到关键作用。已有识别方案主要针对户型
    图,基于语义分割直接识别空间。公共建筑施工图有更多干扰线和图纸元素、更高分辨率及更多空间类型,高
    分辨率使模型难以获取图纸的全局信息,空间类型的多样性导致无法确定空间类型的范围,已有空间识别方案
    难以直接迁移。为了识别公共建筑施工图中的空间,标注公共建筑施工图数据集,包含 20 张标注墙体像素、
    100 张标注构件包围盒的公共建筑施工图,提出基于深度学习的空间边界识别方案及中心线提取和关键线均方
    误差损失函数,以提高空间边界中墙体的识别准确率,通过空间围合识别空间,提出空间边界平滑算法,在保
    持空间形状的同时减少空间边界点数量。实验结果表明,该方法突破了分辨率和空间类型限制,取得了较好的
    空间识别结果,为识别公共建筑施工图的空间提出了解决方案。相较于已有方法,该方法在保证墙体精确率的
    情况下获得了更高的召回率。
    相关文章 | 计量指标
    基于遥感图像的多模态小目标检测
    胡俊, 顾晶晶, 王秋红
    2022, 43(2): 197-204.  DOI: 10.11996/JG.j.2095-302X.2022020197
    摘要 ( 861 )   PDF(3440KB) ( 407 )  
    由于遥感图像目标往往较小且容易受光线、天气等因素的影响,所以单一模态下基于深度学习
    的遥感图像目标检测的准确度较低。然而,不同模态间的图像信息可以相互增强提高目标检测的性能。因此,
    基于 RGB 和红外图像,提出了一种适用于遥感图像多模态小目标检测的平衡多模态深度模型。相比简单地相
    加、点乘和拼接的方式融合 2 个模态的特征信息,设计了一种平衡多模态特征的方法增强目标特征,以弥补单
    一模态信息不足的缺点。首先分别对 RGB 和红外图像进行浅层特征提取;其次,融合 2 个模态的特征信息并
    进行深层的特征提取;然后,基于 YOLOv4 方法,构建了多模态小目标检测模型。最后,基于 VEDAI 数据集,
    在遥感图像多模态小目标检测实验结果中验证了该方法的有效性。
    相关文章 | 计量指标
    基于改进像素相关性模型的图像分割算法
    张燕, 高鑫, 刘以, 张小峰, 张彩明
    2022, 43(2): 205-213.  DOI: 10.11996/JG.j.2095-302X.2022020205
    摘要 ( 138 )   PDF(1643KB) ( 99 )  
    图像分割是计算机视觉中的研究热点和难点。基于局部信息的模糊聚类算法(FLICM)在一定程
    度上提升了模糊聚类算法的鲁棒性,但噪声强度较大时无法获得较好的图像分割效果。针对传统的模糊聚类算
    法分割精度不佳等问题,提出了改进像素相关性模型的图像分割算法。首先通过分析像素的局部统计特征,设
    计了一种新型的像素相关性模型,在此基础上,有效利用非局部信息挖掘图像中的细节,提升图像分割效果。
    实验采用多种评价指标进行分割结果的评估,并与多种模糊聚类系列算法进行对比。在合成图像、自然图像、
    医学图像和遥感图像上的实验表明,基于改进像素相关性的模糊聚类算法可以有效平衡对噪声的抵抗程度和对
    图像细节信息的保留程度,分割效果和鲁棒性优于相关算法。
    相关文章 | 计量指标
    基于分层压缩激励的 ASPP 网络单目深度估计
    廖志伟, 金兢, 张超凡, 杨学志
    2022, 43(2): 214-222.  DOI: 10.11996/JG.j.2095-302X.2022020214
    摘要 ( 139 )   PDF(3117KB) ( 75 )  
    场景深度估计是场景理解的一项基本任务,其准确率反映了计算机对场景的理解程度。传统的
    深度估计利用金字塔池化(ASPP)模块可以在不改变图像分辨率的情况下处理不同像素特征,但该模块未考虑不
    同像素特征之间的关系,导致场景特征提取不准确。针对 ASPP 模块在深度估计中出现的弊端,提出了一种改
    进型的 ASPP 模块,解决了该模块在图像处理中存在的失真问题。首先在卷积核后添加基于分层压缩激励的
    ASPP 结构块,结合各像素特征之间的关系,让网络自适应学习感兴趣部分;再通过构造差值矩阵解决网络层
    次优化问题;最后在室内公共数据集 NYU-Depthv2 上进行深度估计网络模型的搭建。与当前主流算法相比,
    文中算法在定性、定量指标上均有良好表现。在相同的评估指标下,  1 阈值精度提升近 3%,均方误差(RMSE)、
    绝对误差(Abs Rel)下降 1.7%,对数域误差(lg)下降约 0.3%。该方法所训练的网络模型,解决了传统 ASPP 模块
    未考虑不同像素特征之间关系的问题,特征提取能力增强,场景深度估计的结果更加准确。
    相关文章 | 计量指标
    用于视频异常检测的时序多尺度自编码器
    吕浩, 易鹏飞, 刘瑞, 周东生, 张强, 魏小鹏
    2022, 43(2): 223-229.  DOI: 10.11996/JG.j.2095-302X.2022020223
    摘要 ( 194 )   PDF(1550KB) ( 112 )  
    视频异常检测是指识别不符合预期行为的事件。当前许多方法利用重构误差来检测异常,由于
    深度神经网络的强大能力可能会重构出异常行为,这与异常行为重构误差较大的假设不符。而利用预测未来帧
    的方法进行异常检测取得了很好的效果,但这些方法大多未考虑正常样本的多样性,或不能建立视频连续帧之
    间的关联。为了解决该问题,提出了一种时序多尺度自编码器网络用于预测未来帧,并通过预测值与真实值的
    差异完成视频异常检测。该网络不仅明确考虑了正常事件的多样性,而且强大的编码器可以构建长程空间依赖
    关系,进而增强输出特征的多样性,此外,针对复杂的数据集含有较多噪声的特点,提出了去噪网络,进一步
    提升了模型的精度。该方法在达到实时性要求的前提下,在 Avenue 数据集上达到了目前最优的精度。
    相关文章 | 计量指标
    深度可分离卷积和标准卷积相结合的高效行人检测器
    张运波, 易鹏飞, 周东生, 张强, 魏小鹏
    2022, 43(2): 230-238.  DOI: 10.11996/JG.j.2095-302X.2022020230
    摘要 ( 143 )   PDF(768KB) ( 97 )  
    行人检测器对算法的速度和精确度有很高的要求。虽然基于深度卷积神经网络(DCNN)的行人检
    测器具有较高的检测精度,但是这类检测器对硬件设备的计算能力要求较高,因此,这类行人检测器无法很好
    地部署到诸如移动设备、嵌入式设备和自动驾驶系统等轻量化系统中。基于此,提出了一种更好地平衡速度和
    精度的轻量级行人检测器(EPDNet)。首先,主干网络的浅层卷积使用深度可分离卷积以压缩模型的参数量,深
    层卷积使用标准卷积以提取高级语义特征。另外,为了进一步提高模型的性能,主干网络采用特征融合方法来
    增强其输出特征的表达能力。通过实验对比分析,EPDNet在2个具有挑战性的行人数据集Caltech和CityPersons
    上表现出了优越的性能,与基准模型相比,EPDNet 在速度和精确度之间获得了更好的权衡,EPDNet 的速度和
    精确度同时得到了提高。
    相关文章 | 计量指标
    基于轻量级网络的人脸检测及嵌入式实现
    张明, 张芳慧, 宗佳平, 宋治, 岑翼刚, 张琳娜
    2022, 43(2): 239-246.  DOI: 10.11996/JG.j.2095-302X.2022020239
    摘要 ( 169 )   PDF(10890KB) ( 219 )  
    尽管基于卷积神经网络(CNN)的人脸检测器在精度上已经有了很大提升,但所需的计算量和模
    型复杂度越来越高,如何在计算能力有限的嵌入式设备上应用人脸检测模型是一个很大的挑战。针对 320×240
    分辨率输入图像的人脸检测在嵌入式系统上的应用问题,提出了一种基于轻量级网络的低分辨率人脸检测算
    法。该算法使用注意力机制、结合了 Distance-IoU (DIoU)与非极大值抑制(NMS)、使用 Mish 激活函数,同时针
    对人脸特征比例设置合适的先验框,实现了精度和速度的平衡,并部署到嵌入式平台中。具体地,用深度可分
    离卷积替代普通卷积,并在卷积块后加入注意力模块(CBAM),使网络更关注待识别的目标物体;代替 ReLU
    激活函数,采用了 Mish 激活函数来提高模型推理速度;通过结合 DIoU 与 NMS,提高模型对小人脸的检测能
    力。实验在 WIDER FACE 数据集的结果证明,该方法不仅能实时高精度地进行人脸检测,而且在小分辨率输
    入上,精度高于传统算法。扩充数据集之后,模型在复杂光照下的泛化性得到提高。
    相关文章 | 计量指标
    基于深度学习的人物肖像全自动抠图算法
    苏常保, 龚世才
    2022, 43(2): 247-253.  DOI: 10.11996/JG.j.2095-302X.2022020247
    摘要 ( 140 )   PDF(1222KB) ( 97 )  
    针对抠图任务中人物抠图完整度低、边缘不够精细化等繁琐问题,提出了一种基于深度学习
    的人物肖像全自动抠图算法。算法采用三分支网络进行学习,语义分割分支(SSB)学习  图的语义信息,细节
    分支(DB)学习  图的细节信息,混合分支(COM)将 2 个分支的学习结果汇总。首先算法的编码网络采用轻量
    级卷积神经网络(CNN) MobileNetV2,以加速算法的特征提取过程;其次在 SSB 中加入注意力机制对图像特
    征通道重要性进行加权,在 DB 加入空洞空间金字塔池化(ASPP)模块,对图像的不同感受野所提取的特征进
    行多尺度融合;然后解码网络的 2 个分支通过跳级连接融合不同阶段编码网络提取到的特征进行解码;最后
    将 2 个分支学习的特征融合在一起得到图像的  图。实验结果表明,该算法在公开的数据集上抠图效果优于
    所对比的基于深度学习的半自动和全自动抠图算法,在实时流视频抠图的效果优于 Modnet。
    相关文章 | 计量指标
    基于 DOCT 和 SURF 的立体图像零水印算法
    韩绍程, 张鹏
    2022, 43(2): 254-262.  DOI: 10.11996/JG.j.2095-302X.2022020254
    摘要 ( 60 )   PDF(11970KB) ( 56 )  
    针对目前大多数立体图像零水印方案抗几何攻击性能不佳的问题,提出一种基于离散八元数余
    弦变换(DOCT)和加速鲁棒特征(SURF)的盲检测立体图像零水印算法。首先对原始立体图像的左右视点在
    CIEXYZ 空间下的共 6 个分量分别进行平稳小波变换(SWT);然后将以上获得的 6 个低频子带分别进行非重叠
    分块,用于构造对应位置上的八元数图像块,并在空域中直接计算所有八元数图像块 DOCT 后的 DC 系数;最
    后通过比较每一个八元数 DC 系数的模值和其整体均值间的大小关系构造鲁棒特征矩阵,并将其与经过量子密
    钥置乱和 2D-LALM 系统加密后的原始水印进行异或,即可得到最终的认证零水印。此外,零水印检测前,采
    用 SURF 方法对待认证立体图像进行几何校正。仿真结果表明,该算法对于常规攻击和几何攻击均表现出较强
    的鲁棒性能。
    相关文章 | 计量指标
    基于边缘熵和局部 FT 分布的超声图像分割模型
    崔文超, 徐德伟, 孙水发, 潘志红, 王习东
    2022, 43(2): 263-272.  DOI: 10.11996/JG.j.2095-302X.2022020263
    摘要 ( 91 )   PDF(1129KB) ( 53 )  
    由于采用高斯和瑞利分布描述超声图像均存在较大偏差,且分割过程缺乏超声图像边缘信息引
    导,致使其相应的局部高斯分布拟合(LGDF)模型和局部瑞利分布拟合(LRDF)模型对超声图像分割性能不理想。
    针对上述问题,提出了一种边缘熵加权的局部 Fisher-Tippett(FT)分布拟合模型。该模型根据超声图像中目标和
    背景在局部区域满足不同的 FT 分布,利用最大后验概率(MAP)准则导出超声图像分割的最小化能量函数。该
    能量函数的求解采用水平集方法,且通过在长度正则化项中引入边缘熵构造加权函数,引导活动轮廓更好地捕
    获分割目标的弱边缘。通过大量真实超声图像实验验证了提出模型在局部 FT 分布拟合和边缘熵引入 2 方面的
    改进均能有效提升分割性能,且在定性和定量对比评价上均优于现有的多种超声图像分割方法。
    相关文章 | 计量指标
    融合边缘增强注意力机制和 U-Net 网络的医学图像分割
    李翠云, 白静, 郑凉
    2022, 43(2): 273-278.  DOI: 10.11996/JG.j.2095-302X.2022020273
    摘要 ( 1476 )   PDF(1519KB) ( 877 )  
    医学图像分割是医学图像处理领域中的关键步骤,随着深度学习技术的逐步深入,图像分割技
    术有了突飞猛进的发展。然而,在分割过程中,病灶特征的边缘像素点划分仍存在模糊、不准确的问题。为此,
    提出一种边缘增强的注意力模块(CEA),分别进行水平和垂直 2 个不同方向的特征编码捕获位置信息,并通过
    计算位置特征和输入特征之间的偏移量加强边缘信息。将该模块应用基于 U-Net 的医学图像分割网络中,可突
    破卷积核的空间限制,捕获具有位置感知的跨通道信息及更加明确的边缘轮廓信息,从而提高分割的准确性。
    在公开数据集 Kvasir-SEG 上的定量对比实验表明,加入注意力模块的网络在 Dice、精确度、召回率等指标上
    均取得了更好的结果,可有效改善医学图像分割效果。

    相关文章 | 计量指标
    基于多维匹配距离融合的指节纹识别
    黄杰, 魏欣, 杨子元, 闵卫东
    2022, 43(2): 279-287.  DOI: 10.11996/JG.j.2095-302X.2022020279
    摘要 ( 77 )   PDF(942KB) ( 76 )  
    指节纹识别(FKP)作为一种新型的生物特征识别方式,以其安全性和稳定性而备受关注。基于编
    码的方法被认为是该领域最有成效法之一,在模板匹配阶段通常根据所提取的特征信息计算出 2 张图片之间的
    匹配距离来判断样本。然而,一些模糊样本无法通过单一的匹配距离进行有效区分,从而导致较高的错误接受
    率和错误拒绝率。针对这一问题,提出了一种轻量化且有效的多维匹配距离融合方法。主要思想是基于多种编
    码方法中不同匹配距离之间的差异性和互补性,利用支持向量机(SVM)对多种匹配距离所构造出的多维特征向
    量进行分类。其具有极强的通用性,易嵌入到现有的基于编码的方法中。在公开的指节纹数据库 PloyU-FKP
    上进行了从二维到四维匹配距离的大量实验。结果表明,该方法能够普遍提高认证的性能,EER 最多可降低
    22.19%。
    相关文章 | 计量指标
    基于透视降采样和神经网络的地面标志检测
    李玉珍, 陈辉, 王杰, 荣文
    2022, 43(2): 288-295.  DOI: 10.11996/JG.j.2095-302X.2022020288
    摘要 ( 65 )   PDF(9278KB) ( 50 )  
    在智能驾驶领域,为实时精确检测路面的导向标志,提出一种基于透视降采样和神经网络的地标
    检测方法,有效解决传统检测方法实时性较差、复杂场景和远处小目标检测准确率较低的问题。首先,选取图像
    感兴趣区域进行透视降采样,降低道路图像近处分辨率,缩小图像尺寸,同时消除透视投影误差。其次对
    YOLOv3-tiny 目标检测网络进行改进,采用 k-means++算法对自建数据集的边界框聚类;添加卷积层强化浅层特
    征,提升小目标表征能力;改变特征金字塔融合尺度,将预测输出调整为适合地标尺寸的 26×26 和 52×52。最后,
    在自建多场景数据集上测试,准确率由 78%提升到 99%,模型大小由 33.8 MB 减小为 8.3 MB。结果表明,基于
    透视降采样和神经网络的地标检测方法鲁棒性强,对小目标检测精度更高,易于在低端嵌入式设备上部署。
    相关文章 | 计量指标
    一种优化 YOLO 模型的交通警察目标检测方法
    李妮妮, 王夏黎, 付阳阳, 郑凤仙, 何丹丹, 袁绍欣
    2022, 43(2): 296-305.  DOI: 10.11996/JG.j.2095-302X.2022020296
    摘要 ( 224 )   PDF(19603KB) ( 356 )  
    针对复杂交通场景中交通警察目标检测与定位准确率低的问题,提出一种优化 YOLOv4 模型的
    交通警察目标检测方法。首先,采用 4 种随机转换方式对自建的交通警察数据集进行扩充,解决了模型过拟合
    问题并提高模型的泛化能力;其次,将 YOLOv4 主干网络替换为 MobileNet 并引入 Inception-Resnet-v1 结构,
    有效地减少了参数总量并加深了网络层数;然后,使用 K-means++聚类算法对自建数据集进行聚类分析以重新
    定义网络的初始候选框,提高了交通警察目标深度特征的学习效率;最后,引入焦点损失函数以优化分类损失
    函数,解决了训练中正负样本数量不平衡问题。研究结果表明,优化后的 YOLOv4 模型大小仅 50 M,AP 值达
    98.01%,与 Faster R-CNN,YOLOv3 和原始 YOLOv4 模型相比均有提升。有效解决了目前复杂交通场景中交
    通警察目标的漏检、误检及检测精度低等问题。
    相关文章 | 计量指标
    计算机图形学与虚拟现实
    民机飞行机组应急逃生设计混合现实仿真系统
    吴程程, 吕毅, 袁新浩, 许澍虹
    2022, 43(2): 306-315.  DOI: 10.11996/JG.j.2095-302X.2022020306
    摘要 ( 83 )   PDF(4249KB) ( 74 )  
    开展民机飞行机组应急逃生仿真旨在飞机研制早期发现飞行机组逃生口设计的潜在问题,确保
    飞行机组成员的人身安全。提出了一种民机飞行机组应急逃生混合现实仿真系统设计方案,进行了系统搭建与
    实验验证。针对系统中人体虚实匹配的关键问题,提出一种光-惯混合追踪的全身人体运动捕捉方法,结合基
    于 Kinect2 图像识别的人体关键尺寸快速匹配技术,可以有效提升人体虚实匹配效率与鲁棒性。相关成果已应
    用于某型国产大型民机研制中,为飞行机组逃生口设计验证与评估提供了快速、有效的解决方案。
    相关文章 | 计量指标
    两阶段可调节感知蒸馏网络的虚拟试衣方法
    陈宝玉, 张怡, 于冰冰, 刘秀平
    2022, 43(2): 316-323.  DOI: 10.11996/JG.j.2095-302X.2022020316
    摘要 ( 80 )   PDF(5051KB) ( 71 )  
    基于图像的虚拟试衣能将目标服装图像合成到人物图像上,此任务近年来因其在电子商务和时
    装图像编辑上广泛应用而备受关注。针对该任务的特点和已有方法的缺陷,提出一种两阶段可调节感知蒸馏方
    法(TS-APD)。该方法包括 3 个步骤:①分别对服装图像和人物图像预训练 2 个语义分割网络,生成更准确的服
    装前景分割和上衣分割;②利用这 2 个语义分割和其他解析信息训练基于解析器的“导师”网络;③以“导师”网
    络生成的假图像作为输入,以原始真实人物图像作为监督,采用一种 TS-APD 方案训练无解析器的“学生”网络。
    最终经过蒸馏的“学生”网络能在不需要人体解析的情况下,生成高质量的试衣图像。在 VITON 数据集上的实
    验结果表明,该算法在 FID、L 1 和 PCKh 的评分分别可达 9.10,0.015 3,0.985 6,均优于现有方法。用户研究
    结果也表明,与已有方法相比,所提方法生成的图像更加逼真,所有偏好得分均达 77%以上。
    相关文章 | 计量指标
    基于道钉中心点定位的几何特征扣件定位算法
    曹义亲, 易湖, 邱沂, 周一纬
    2022, 43(2): 324-332.  DOI: 10.11996/JG.j.2095-302X.2022020324
    摘要 ( 70 )   PDF(25856KB) ( 64 )  
    针对因轨道图像中图像歪斜、尺寸不一等导致定位失效、精度降低的问题,提出基于道钉中心点
    定位的几何结构特征扣件定位算法。采用先定位道钉中心点再定位扣件的思想。首先在图像预处理得到边缘图像
    的基础上,对图像边缘进行腐蚀与膨胀处理,使道钉边缘具备似圆性,再通过改进 Hough 变换进行圆形检测定位
    道钉所处大致区域并进行扩充,然后从原图像中粗提取出道钉区域图像;随后进行边缘检测并采用 OpenCV 轮廓
    提取及多边形检测算法精确拟合道钉六边形,计算出道钉中心点;最后根据提出的几何结构特征扣件定位算法计
    算各顶点的位置,从而实现轨道扣件的精确定位。仿真实验结果表明,该算法定位准确度达 99.33%,定位精度
    达 0.997,定位速率为 29.8 张/秒,优于相关对比算法。同时,在不同的天气条件、道钉腐蚀、道钉遮挡等情况下,
    新算法具备较好的鲁棒性及一定的抗干扰能力。
    相关文章 | 计量指标
    基于全局姿态感知的轻量级人体姿态估计
    刘玉杰, 张敏杰, 李宗民, 李华
    2022, 43(2): 333-341.  DOI: 10.11996/JG.j.2095-302X.2022020333
    摘要 ( 203 )   PDF(4932KB) ( 132 )  
    人体姿态估计是近年来人机交互领域的热点话题。当前,常见的人体姿态估计方法集中在通过增
    加网络的复杂性来提高精度,却忽视了模型的效益问题,导致模型在实际应用中精度高但计算资源消耗巨大。针
    对这一问题设计了一个基于全局姿态感知的轻量级人体姿态估计模型,其在MSCOCO数据集上精度达68.2% AP,
    速度保持在 255 fps,参数量和 FLOPS 仅为 OpenPose 方法的 10%和 0.9%。在人体姿态估计任务中,根据预测的
    关键节点数量来设置网络的输出通道数,导致对每个关键点的检测都是独立的。关键点之间的相对位置、整体布
    局等全局信息在困难样本的姿态估计任务中非常重要,但是在之前的研究中未考虑到。为了利用全局姿态信息,
    设计了一个全局姿态感知模块来提取全局姿态特征,并利用双分支网络融合全局和局部姿态特征。实验表明,利
    用全局姿态感知模块的轻量级人体姿态估计网络在 MPII 和 MSCOCO 数据集上精度分别提高了 1.5%和 1.3%。
    相关文章 | 计量指标
    熔丝制造的三维连续编织填充图案
    吴焕晓, 姚远, 杨金秀, 丁成
    2022, 43(2): 342-347.  DOI: 10.11996/JG.j.2095-302X.2022020342
    摘要 ( 76 )   PDF(2071KB) ( 60 )  
    为提高熔丝制造(FFF)工件的机械强度,降低各向异性,提出一种 3D 连续编织路径规划方法。
    采用连续纤维增强丝材作为打印材料,设计了 1 个 8 层循环结构,利用 3D 打印机喷嘴挤出丝材生成经纬纱线,
    控制 FFF 平台在 z 方向的运动,生成类似 3D 编织的连续沉积路径,不同层的纤维相互交错和嵌入以实现相邻
    切片平面之间的互锁,以提高层内与层间的连接强度。这种循环结构支持连续的路径规划,因此能够在常规三
    轴 FFF 平台上进行制造,具有广泛的适用性。通过与标准样品进行对比,验证了编织结构的合理性和可行性。
    实验表明,3D 连续纤维编织打印路径能够支持不同结构的填充,并能够有效降低由于材料分层沉积产生的机
    械性能的各向异性,提高具有复杂结构打印件的可靠性。
    相关文章 | 计量指标
    工业设计
    汉字字体笔画形态与情感意象的关系模型
    欧阳晋焱, 高旋涵, 张书涛, 王旭红, 周爱民
    2022, 43(2): 348-355.  DOI: 10.11996/JG.j.2095-302X.2022020348
    摘要 ( 132 )   PDF(2562KB) ( 105 )  
    为了揭示汉字字体形态特征与受众情感意象之间的内在关系,从视觉认知的角度出发,探索性
    地提出一种汉字字体笔画形态与情感意象的关系模型。首先,利用形态分析法对汉字字体笔画形态设计要素进
    行分析、梳理,构建字体笔画形态设计要素项目与类目表;然后,运用 K 均值聚类算法筛选出代表性的情感意
    象词汇,通过语意差分法制作调查问卷,得到各字体样本的情感意象评分;最后,运用多元线性回归方法建立
    字体笔画形态设计要素与情感意象的关系模型。从表达式的系数中可分析出各形态特征要素对情感意象的影响
    程度,该模型为汉字字体设计的意象定位及研究提供一种新的思路和方法。将该模型的结论应用于汉字字体设
    计实践中,结果表明,该方法具有良好的可行性与可靠性。
    相关文章 | 计量指标
    智能汽车座舱人机交互任务复杂度分析方法
    马宁, 王亚辉
    2022, 43(2): 356-360.  DOI: 10.11996/JG.j.2095-302X.2022020356
    摘要 ( 317 )   PDF(780KB) ( 275 )  
    智能汽车座舱中的人机交互任务及行为直接影响车内用户体验。为了帮助汽车内外饰和人机交
    互界面设计师有效规避界面可用性差的风险,对智能汽车中人机交互行为进行了定量化的研究,总结了人机交
    互任务复杂度量化指标,挖掘了影响智能座舱内部人机交互复杂度的具体任务指标及权重分布,提出了基于熵
    的智能汽车人机交互任务复杂度测量方法,最终通过某智能汽车座舱的实例进行了算法验证。结果显示,座舱
    中的人机交互任务逻辑结构、人机交互知识等级和认知量、人机交互数字界面布局的复杂程度,对车内的人机
    交互任务复杂度影响较大,需要设计师重点关注。该方法可以帮助设计师规避设计复杂度过高、用户学习成本
    过高的风险,可辅助设计师对上述指标相关的设计问题进行提前干预。
    相关文章 | 计量指标
    本期样刊
    2022年第2期样刊
    2022, 43(2): 361-361. 
    摘要 ( 51 )   PDF(109822KB) ( 43 )  
    相关文章 | 计量指标