欢迎访问《图学学报》 分享到:
双月刊,创刊于1980年
主管单位:中国科学技术协会
主办单位:中国图学学会
编辑出版:《图学学报》编辑部
主  编:汪国平
编辑部主任:侯晓红
ISSN 2095-302X
CN 10-1034/T
当期目录
2025年, 第46卷, 第1期 刊出日期:2025-02-28 上一期   
全选选: 隐藏/显示图片
封面
2025年第1期封面
2025, 46(1): 1. 
PDF 37     104
相关文章 | 计量指标
目次
2025年第1期目次
2025, 46(1): 2. 
PDF 26     44
相关文章 | 计量指标
图像处理与计算机视觉
基于改进YOLOv8的配电线路绝缘子缺陷级联检测方法
赵振兵, 韩钰, 唐辰康
2025, 46(1): 1-12.  DOI: 10.11996/JG.j.2095-302X.2025010001
HTML    PDF 111     114

针对无人机航拍配电线路时因安全限制导致背景复杂动态、绝缘子缺陷形态不规则、缺陷特征不明显与缺陷信息难捕捉的问题,提出了一种基于改进YOLOv8的配电线路绝缘子缺陷级联检测方法。在第一阶段,通过YOLOv8模型自动提取绝缘子部件图像,为第二阶段绝缘子缺陷检测提供准确的输入,摒除冗余背景信息的影响。在第二阶段,利用ConvNeXt V2主干网络提升模型对不规则形态目标的识别能力,提升网络的特征提取能力;通过在特征融合过程中加入边缘知识融合模块,精准提取缺陷边缘信息;设计自适应形状IoU增强方法,采用自适应训练样本选择策略优化正负样本比例,并使用充分考虑边界框回归样本自身形状和尺度等固有属性的Shape-IoU损失函数,使模型聚焦目标本质特征,改善模型漏检误检情况,提高检测的准确性和鲁棒性。经实验证明,基于改进YOLOv8的配电线路绝缘子缺陷级联检测方法比基线模型平均精确率提高了17.3%,有效提升配电线路绝缘子缺陷检测准确率,为电力系统的安全维护提供了有力的技术支持。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于EE-YOLOv8s的多场景火灾迹象检测算法
崔克彬, 耿佳昌
2025, 46(1): 13-27.  DOI: 10.11996/JG.j.2095-302X.2025010013
HTML    PDF 58     44

针对目前烟火场景检测中,光照变化、烟火动态性、复杂背景、目标过小等干扰因素导致的火灾迹象目标误检和漏检的问题,提出一种YOLOv8s改进模型EE-YOLOv8s。设计MBConv-Block卷积模块融入YOLOv8的Backbone部分,实现EfficientNetEasy特征提取网络,保证模型轻量化的同时,优化图像特征提取;引入大型可分离核注意力机制LSKA改进SPPELAN模块,将空间金字塔部分改进为SPP_LSKA_ELAN,充分捕获大范围内的空间细节信息,在复杂多变的火灾场景中提取更全面的特征,从而区分目标与相似物体的差异;Neck部分引入可变形卷积DCN和跨空间高效多尺度注意力EMA,实现C2f_DCN_EMA可变形卷积校准模块,增强对烟火目标边缘轮廓变化的适应能力,促进特征的融合与校准,突出目标特征;在Head部分增设携带有轻量级、无参注意力机制SimAM的小目标检测头,并重新规划检测头通道数,加强多尺寸目标表征能力的同时,降低冗余以提高参数有效利用率。实验结果表明,改进后的EE-YOLOv8s网络模型相较于原模型,其参数量减少了13.6%,准确率提升了6.8%,召回率提升了7.3%,mAP提升了5.4%,保证检测速度的同时,提升了火灾迹象目标的检测性能。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于轻量化改进YOLOv8的通信光缆缺陷检测
王志东, 陈晨阳, 刘晓明
2025, 46(1): 28-34.  DOI: 10.11996/JG.j.2095-302X.2025010028
HTML    PDF 40     34

在全介质自承式(ADSS)通信光缆缺陷检测领域,针对跨尺度的电腐蚀缺陷做检测存在计算量要求高、检测精度低的问题,提出了一种改进YOLOv8的ADSS通信光缆缺陷检测方法。首先,对自建通信光缆缺陷数据集切片,防止光缆存在的电腐蚀缺陷在缩放的过程中丢失;其次,使用LS-FPN的结构代替传统的颈部结构,保留通道维度中的有利位置信息,解决光缆表面的缺陷尺度跨度问题的同时提高定位缺陷能力;再者,引用了可变形卷积的思想,对原有backbone网络的卷积进行替换,使得网络在特征提取的过程中能够更为关注周围缺陷信息;最后,用Focus-MPDIoU损失函数代替原有的CIoU,Focus-MPDIoU在处理边界情况时表现优异,能够避免过于偏激的损失梯度。实验结果表明,该方法在ADSS通信光缆缺陷数据集上进行实验验证,改进后的模型分别在mAP50-95和mAP50上达到50.6%和87.8%,相比YOLOv8n分别提升了2.1%和3.7%。同时,计算量GFLOPs降低至6.8,参数量降低至1.96 M,降低了检测设备的配置要求,贴近轻量化的工业需求。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于转置注意力和CNN的图像超分辨率重建网络
陈冠豪, 徐丹, 贺康建, 施洪贞, 张浩
2025, 46(1): 35-46.  DOI: 10.11996/JG.j.2095-302X.2025010035
HTML    PDF 47     27

基于Transformer的图像超分辨率重建方法近年来表现出了显著的性能。针对现有方法仍然面临诸如高频信息不完全恢复、图像重建时附加像素激活不足、跨窗口信息交互不充分以及由残差连接引起的训练不稳定等挑战,提出了基于转置注意力和CNN的图像超分辨率重建网络(TSA-SFNet)。TSA-SFNet通过调整窗口多头自注意力模块来缓解残差连接引起的振幅问题,并引入通道注意力以激活更多像素进行图像重建。此外,为了加强相邻窗口之间的交互以捕获更多的结构信息,并实现对高频细节更全面的重建,同时引入了重叠窗口注意力和卷积前馈神经网络。在经典的超分辨率任务和真实世界的超分辨率挑战方面对该网络模型进行了定量和定性评估。实验结果表明,TSA-SFNet在5个常用基准数据集上取得了最好的结果,并生成了更为逼真的超分辨率重建图像。

数据和表 | 参考文献 | 相关文章 | 计量指标
一种强化伪造区域关注的深度伪造人脸检测方法
张文祥, 王夏黎, 王欣仪, 杨宗宝
2025, 46(1): 47-58.  DOI: 10.11996/JG.j.2095-302X.2025010047
HTML    PDF 40     29

深度伪造人脸技术发展迅速并已被广泛应用于各种不良途径,检测被篡改的面部图像和视频也因此成为了一个重要的研究课题。现有的卷积神经网络存在过拟合,泛化性差的问题,在未知的合成人脸数据上表现不佳。针对这一不足,提出一种强化伪造区域关注的深度伪造人脸检测方法。首先,引入注意力机制处理用于分类的特征图,学习到的注意力图可以突出被篡改的面部区域,提高了模型的泛化能力;其次,在骨干网络之后连接了伪造区域检测模块,通过检测多尺度锚框中是否存在伪造痕迹,减少了全局人脸信息的干扰,进一步加强了模型对局部伪造区域的关注;最后,引入一种一致性表示学习框架,通过明确约束同一输入的不同表示之间的一致性,使模型更加关注内在的伪造证据,避免过拟合。在FaceForensics++,Celeb-DF-v2和DFDC等3个数据集上,分别以EfficientNet-b4和Xception作为骨干网络进行实验。结果表明,该方法在数据集内评估时达到了较好的性能,在跨数据集评估时则优于原网络和其他先进的方法。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于点云特征增强的复杂室内场景3D目标检测
苑朝, 赵明雪, 张丰羿, 冯晓勇, 李冰, 陈瑞
2025, 46(1): 59-69.  DOI: 10.11996/JG.j.2095-302X.2025010059
HTML    PDF 45     47

在复杂室内场景下的3D点云目标检测中,点云规模大且目标密集细节多。针对现有检测算法处理点云数据时会丢失大量局部特征且不能提取足够的空间信息与语义信息,致使检测精度低的问题,提出了一种基于改进VoteNet的点云特征增强的复杂室内场景3D目标检测(PFE)算法。首先,利用动态特征补偿模块模拟种子点集与分组集点云特征的交互查询过程,逐步恢复丢失的特征来进行特征补偿;其次,在特征提取部分引入残差MLP模块,通过残差结构搭建更深层的特征学习网络以挖掘更细节的点云特征;最后,在目标提案生成阶段引入特征自注意力机制对一组独立的目标点进行语义关系建模,生成新的特征映射。在公开数据集SUN RGB-D和ScanNet V2上进行实验,实验证明改进后的模型对室内目标的检测精度相较于基准模型在mAP@0.25上分别提升了5.0%和11.5%,大量的消融实验证明了每个改进模块的有效性。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于多尺度特征融合的轻量型野外蝙蝠检测
王杨, 马唱, 胡明, 孙涛, 饶元, 袁振羽
2025, 46(1): 70-80.  DOI: 10.11996/JG.j.2095-302X.2025010070
HTML    PDF 47     29

野外蝙蝠检测对于生态保护和科学研究具有重要意义。针对计算资源有限和复杂野外环境带来的挑战,提出了一种轻量型蝙蝠检测模型(LiteDETR-Bat),旨在实现高效的实时检测。首先为了解决特征映射冗余问题,引入重参数卷积高效层聚合网络(RCELAN)替换传统的ResNet主干网络,采用多分支特征聚合机制,有效降低了计算复杂度和参数量。其次设计了动态采样多尺度特征融合(DS-MFF),该结构集成空洞卷积和动态采样算子,通过扩大感受野并自适应调整采样位置,优化多尺度特征融合,提升多样化特征处理时模型的灵活性和鲁棒性。最后在安徽省野外环境下采集了一个涵盖多种光照条件、视角变化及蝙蝠形态变化的蝙蝠数据集,并进行了模型性能等相关实验。实验结果表明,该LiteDETR-Bat模型不仅能够使参数量降低了46.5%,mAP达到97.2%,同时在准确性和实时性上相比于YOLO系列算法均取得了一定地提升。LiteDETR-Bat模型为野外蝙蝠的监测与保护工作提供了有力的技术支持,展现了其在生态监测和生物多样性保护中的应用潜力。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于元学习的小样本指针式仪表检测方法
孙前来, 林绍杭, 刘东峰, 宋晓阳, 刘佳耀, 刘瑞珍
2025, 46(1): 81-93.  DOI: 10.11996/JG.j.2095-302X.2025010081
HTML    PDF 30     15

仪表定位精度是保证指针式仪表示数准确识别的前提。复杂工业场景下仪表样本难以采集,小样本情况下,现有指针式仪表定位检测方法存在检测精度低、实时性差的问题。为此,提出了基于元学习的小样本指针式仪表检测方法Sparse-Meta-DETR。并以Meta-DETR为目标检测基线模型,采用元学习训练策略,在元训练阶段构建多个小样本任务训练Sparse-Meta-DETR模型,增强特征相关聚合模块对特征空间中支持集和查询集类别的余弦距离的度量能力,使模型能够在元测试阶段小样本任务中识别图像包含的类别,快速适应新类小样本任务,检测复杂工业场景图像中包含的指针式仪表;引入轻量级主干网络Efficientnet b1作为特征提取器,减少模型的计算复杂度和参数量;设计评分网络对查询特征稀疏采样,构建稀疏化遮罩选取前景特征,引导Transformer编/解码器对前景特征进行处理,进一步减少计算量并提高检测精度。使用Sparse-Meta-DETR模型,20-shot时指针式仪表定位检测精度指标AP50和AP75分别达到了94.2%和87.5%,10-shot时的AP50达到了91.1%;相较于最初的基线模型,改进模型的时间复杂度下降了74.5%。实验结果表明,Sparse-Meta-DETR不仅能够保证样本匮乏时仪表定位的精度,还可以有效地提高仪表定位的实时性,其整体性能优于Meta-RCNN等小样本深度学习算法。

数据和表 | 参考文献 | 相关文章 | 计量指标
SDENet:基于多尺度注意力质量感知的合成缺陷数据评价网络
卢洋, 陈林慧, 姜晓恒, 徐明亮
2025, 46(1): 94-103.  DOI: 10.11996/JG.j.2095-302X.2025010094
HTML    PDF 17     9

通过对数据扩增方式合成的缺陷数据进行质量评估,有助于实现缺陷数据高质量扩充,进而缓解缺陷数据不足导致的检测模型性能不佳问题。针对现有质量评价算法在评估合成缺陷数据质量时更关注数据的失真特性而忽略了对数据缺陷属性考量的问题,提出一种基于注意力特征增强(AFE)和多尺度注意力质量感知(MAQP)的模型SDENet,综合考虑数据的失真特性和缺陷属性进行质量评价。首先,AFE通过双分支池化操作提高模型对不同尺寸、位置缺陷的泛化能力,并结合注意力机制增强模型对特征的表达。其次,MAQP对AFE增强后的特征进行向量化与融合处理,以更好地感知合成缺陷数据质量。最后,对融合后的特征进行质量评估,得到最终的评估分数。在构建的合成道路裂缝缺陷数据集上进行实验,结果表明,SDENet模型在RMSE,RMAE,PLCC和SROCC指标上均取得最优结果,比次优模型依次提升10.7%,5.0%,1.8%和1.8%,验证了模型的有效性。在失真数据集TID2013上,SDENet模型也取得较有竞争的结果,在PLCC和SROCC指标上依次达到0.902和0.876。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于频域和空域多特征融合的深度伪造检测方法
董佳乐, 邓正杰, 李喜艳, 王诗韵
2025, 46(1): 104-113.  DOI: 10.11996/JG.j.2095-302X.2025010104
HTML    PDF 36     40

在当今社会,面部伪造技术的迅速发展对社会安全构成了巨大挑战,尤其是在深度学习技术被广泛应用于生成逼真的伪造视频的背景下。这些高质量的伪造内容不仅威胁到个人隐私,还可能被用于不法活动。面对这一挑战,传统的基于单一特征的伪造检测方法已经难以满足检测需求。因此,提出了一种基于频域和空域多特征融合的深度伪造检测方法,以提高面部伪造内容的检测准确率和泛化能力。并将频域动态划分为3个频带来提取在空域中无法挖掘的伪造伪影;对空域使用EfficientNet_b4网络和Transformer架构多尺度划分图像块来计算不同块的差异、根据上下图像块之间的一致性信息来进行检测以及捕获更精细的伪造特征信息;最后使用查询-键-值机制的融合块,将上述中的频域和空域的方法进行融合,从而更全面地挖掘到2个域中的特征信息,提升伪造检测的准确性和迁移性。大量的实验结果显示该方法有效,其性能明显优于传统深度伪造检测方法。

数据和表 | 参考文献 | 相关文章 | 计量指标
面向域自适应目标检测的一致无偏教师模型
程旭东, 史彩娟, 高炜翔, 王森, 段昌钰, 闫晓东
2025, 46(1): 114-125.  DOI: 10.11996/JG.j.2095-302X.2025010114
HTML    PDF 25     21

作为一种重要手段,自训练方法极大提升了域自适应目标检测(DAOD)性能,其主要通过教师网络对目标域数据进行预测,然后选择高置信度的预测结果作为伪标签来指导学生网络训练。然而,由于源域与目标域存在显著的域差异,教师网络产生的伪标签质量不佳,进而影响学生网络训练,降低了模型性能。因此,提出一种面向DAOD的一致无偏教师(CUT)模型。首先,在教师网络设计自适应阈值生成(ATG)模块,该模块通过高斯混合模型(GMM)在训练过程为每张图像生成自适应阈值筛选伪标签,保证伪标签数量时序一致性,提高伪标签质量。其次,提出预测引导样本选择(PSS)策略,借助教师网络中区域建议网络的预测结果为学生网络选择样本,使选择的样本与真实结果具有一致性,降低质量不佳伪标签对学生网络的影响。此外,为了提升对小目标和数量较少困难类别目标的检测性能,设计混合域增强(MDA)模块,在训练过程中生成包含源域和类目标域随机信息的混合域图像对学生网络进行训练。将该模型在3个场景数据集进行实验,性能分别提升4.0%,5.8%和3.7%,验证了该算法的有效性。值得注意的是,该模型CUT首次利用自训练方法来解决可见光图像到红外图像的较大域差异问题。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于语义相似性传播的图像彩色化
孟思弘, 刘浩, 方昊天, 僧冰枫, 杜正君
2025, 46(1): 126-138.  DOI: 10.11996/JG.j.2095-302X.2025010126
HTML    PDF 36     24

图像彩色化旨在将灰度图像转换为彩色图像,这一技术在计算机图形学和计算机视觉领域内长期受到研究者们的广泛关注,并在图像复原、医学成像、电影修复、艺术创作等诸多领域广泛应用,在实际应用中展现出巨大的潜力。经过数十年的发展,研究者们提出了大量基于交互、基于规则以及基于深度学习的算法来提升图像彩色化的效果。尽管如此,现有的图像彩色化算法仍然存在一些显著的缺陷,如计算效率偏低、交互繁琐、颜色饱和度偏低以及无法避免颜色溢出现象等问题。针对上述问题,提出了一种基于语义相似性传播的图像彩色化算法。算法首先利用深度神经网络提取输入灰度图像的语义特征,并构建特征空间。然后,将图像彩色化问题形式化为一个高效的、基于语义相似性传播的能量优化问题,通过优化能量函数求解灰度图像的色度值,从而将用户提供的笔触颜色传播到图像的其他区域。此外,还采用了三线性插值的方法加速能量优化和颜色传播,大幅提升了计算效率。为了验证算法的有效性,在收集的图像集上从多个角度进行了实验评估,包括图像视觉效果、生成图像的质量、算法的运行时间,以及用户交互体验。大量定性和定量实验结果表明,该算法在更少的用户交互下实现了更准确、高效、自然的彩色化效果。

数据和表 | 参考文献 | 相关文章 | 计量指标
计算机图形学与虚拟现实
基于扩散模型的文本生成材质贴图的泛化性优化方法
涂晴昊, 李元琪, 刘一凡, 过洁, 郭延文
2025, 46(1): 139-149.  DOI: 10.11996/JG.j.2095-302X.2025010139
HTML    PDF 26     19

针对现有的材质贴图数据集存在着文字描述不足且纯图像数据集规模庞大的现状,及传统的生成模型推理错误时难以获得额外的超参数来生成新的结果等问题,提出一种基于稳定扩散模型的文本生成材质贴图的泛化性优化方法,采用分阶段的方式训练模型:使用大规模纯图像数据集对扩散模型进行微调,以拟合图像的生成;使用小规模含文本标注的数据集学习语义信息;引入新的解码器对扩散模型生成的隐编码重建得到材质贴图;最终可以通过输入文本描述获得多组随机生成的且符合描述的材质贴图结果。该方法使用Colossal架构组织代码,大大降低了训练的硬件要求;将图像拟合数据集、语义信息学习的工作分开,使用大规模图像数据集拟合模型参数,使用小规模文本数据学习语义信息,提高了模型的泛化性,减少了对多模态数据集规模的需求。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于多重特征提取和点对应关系的三维点云非刚配准
吴亦奇, 何嘉乐, 张甜甜, 张德军, 李艳丽, 陈壹林
2025, 46(1): 150-158.  DOI: 10.11996/JG.j.2095-302X.2025010150
HTML    PDF 32     18

为实现非刚点云间的精确配准,并在配准过程中准确建立点对应关系,提出了一种基于多重特征提取和点对应关系建模的无监督三维点云非刚配准网络。网络由多重特征提取、匹配精细化和形状感知注意力模块构成。首先,提取输入的源点云与目标点云的多重特征,并计算特征之间的相似度获得特征相似度矩阵。随后,将特征相似矩阵输入到网络中的匹配精细化模块中使用软硬匹配结合的方法生成点对应关系矩阵。最后,将目标点云的特征、源点云和点对应关系矩阵输入形状感知注意力模块,得到最终配准结果。通过此方法,配准结果可以同时具有与目标点云的点对应关系和形状相似性。在公共数据集及合成数据集上进行实验,可视化效果及定量结果比较表明,该方法可准确获得源点云与目标点云间的点对应关系和形状相似性,有效实现无监督三维点云非刚配准。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于计算着色器的并行Delaunay三角剖分算法
陈国军, 李震烁, 陈昊祯
2025, 46(1): 159-169.  DOI: 10.11996/JG.j.2095-302X.2025010159
HTML    PDF 25     25

Delaunay三角剖分是一种经典的计算几何算法,在众多领域中有着广泛地使用,随着实际需求的不断提高,现有的Delaunay三角剖分算法已不能满足大规模数据的需求,为此,提出了一种基于计算着色器的并行Delaunay三角剖分方法,该方法通过纹理缓存将点集数据输入到计算着色器中,并利用计算着色器加速Delaunay三角剖分,同时在现有方法的基础上提出动态插入法解决点集在离散空间中的重映射问题。此外,为了能够让显存有限的GPU构建出远超其显存限制的Delaunay三角网,提出基于计算着色器的分区双向扫描算法,并将点集划分为多个子区域,然后通过扫描各个子区域的方式进行构网。实验结果表明:在相同运行环境下,基于计算着色器的方法与现有的方法相比缩短了构网时间。同时分区双向扫描算法很好地解决了GPU的显存瓶颈问题,能让显存有限的GPU构建出远超其显存容量的Delaunay三角网。

数据和表 | 参考文献 | 相关文章 | 计量指标
新型巡检车辆侧向行驶稳定性的鲁棒性分析与控制
倪利伟, 吴量, 姜宏生, 邢彪
2025, 46(1): 170-178.  DOI: 10.11996/JG.j.2095-302X.2025010170
HTML    PDF 22     11

传统车辆在面对不确定干扰时,车辆质心侧偏角与横摆角速度易偏离理想值,导致整车侧向行驶稳定性恶化。为提高车辆在不确定干扰下的侧向行驶稳定性与鲁棒性。首先基于一体化动力学模型、序列二次规划法以及自适应滑膜控制算法(ASMC)搭建了整车行驶稳定性分层协同控制策略(HCC)。其次基于线控转向、线控驱动以及线控制动设计了一款新型四轮转向-分布式驱动巡检车辆(FSDDIV)。最后基于Simulink与Carsim进行不确定干扰下的车辆侧向行驶稳定性联合仿真分析。结果表明,相比于常用的平均分配法(ADM),该HCC控制策略的控制效果表现更佳,在面对不确定行驶工况、不确定行驶车速以及系统参数不确定性时,车辆质心侧偏角与横摆角速度的最大偏离误差改善比例分别达到了75.5%与84.8%,72.8%与86.0%,71.0%与83.8%,且整体上优于同类的分层线性二次型最优控制理论(HLQR)。该控制策略对不确定干扰表现不敏感,呈现较好的鲁棒性与稳定的控制效果,能够适应多工况的巡检任务。

数据和表 | 参考文献 | 相关文章 | 计量指标
辐射场表面物点引导的主动视图选择
谢文想, 许威威
2025, 46(1): 179-187.  DOI: 10.11996/JG.j.2095-302X.2025010179
HTML    PDF 27     11

神经辐射场(NeRF)的出现显著提高了新视图渲染和3D重建的质量,但其数据收集过程仍然依赖于人工经验,这限制了在未知环境探索和规划等任务上的应用,因此,如何有效选择最具信息增益的视图变得至关重要,为此提出了一种新的主动视图选择策略。首先,通过体渲染权重获取训练光线投射到场景表面附近的三维点,然后计算每个三维点对于候选视图的可见性,并使用光度置信度加权来衡量候选视图,最终选择可见三维点较少且置信度低的候选视图作为新的训练视图。在Blender数据集上的实验表明,与现有的方法相比,该方法在下一最佳视图和下一批最佳视图选择上分别提高了3.88 dB和5.88 dB的PSNR质量,同时视图选择速度提高近30倍。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于笔刷的交互式元素填充技术
梁沐, 徐鹏飞, 黄惠
2025, 46(1): 188-199.  DOI: 10.11996/JG.j.2095-302X.2025010188
HTML    PDF 39     23

元素填充是一种将多个元素紧密填充到某个区域的视觉艺术形式,广泛应用于标志、艺术作品、海报和广告设计。在进行元素填充设计时,需要手动地将元素调整到合适的大小和方向,设计过程重复且耗时。现有的元素填充算法可以帮助设计师快速对元素进行排列。使用这些算法将设计过程分为2步,即首先指定填充区域,再进行元素填充。而在实际创作中,元素的排列与填充区域的确定是同时进行的。因此现有的算法与设计过程不适配。采用易于使用的笔刷作为交互工具,实现拟定边界的同时完成填充。提出了一种基于笔刷和物理模拟的元素填充技术,每个元素都由三角形网格表示并应用于一个弹簧质量系统。通过物理模拟使不重叠的元素相互吸引,重叠的元素相互排斥,达到紧凑填充的目标。与常用于颜色填充的传统笔刷的使用方式类似,笔刷能够实时地完成元素填充。通过邀请多位用户使用本文的系统完成设计任务,验证了该方法在大大减少设计耗时的同时,可显著提高设计过程中的可控性和填充结果的紧凑性。

数据和表 | 参考文献 | 相关文章 | 计量指标
工业设计
基于视觉因素的地铁调度人机界面优化设计评价
李博, 宣金鸽, 薛艳敏, 余隋怀, 王娟
2025, 46(1): 200-210.  DOI: 10.11996/JG.j.2095-302X.2025010200
HTML    PDF 30     15

为了优化地铁调度员的任务绩效。以CATIA构建虚拟人体模型并进行视域等级划分,将调度界面和视域进行栅格化处理并构建人机布局优化模型,调度界面进行模块化处理并分析各模块的重要程度,以粒子群算法为基础引入惯性权重得出最优布局方案。以人机界面信息显示优化策略为准则,对人机界面的色彩、字体、图标进行优化设计,搭建眼动实验平台,选用AOI首次注视时间、AOI注视持续时间、AOI注视次数和AOI平均反应时及热点图作为人机界面任务绩效的判断指标。得到结果为:①人机布局优化模型布局设计将调度员注意力提升52%;②AOI首次注视时间、AOI注视持续时间和AOI平均反应时P值均小于0.05,具有显著性差异;优化后的调度界面AOI平均反应时提升50%;③AOI注视次数虽P值大于0.05,在统计学上无意义,但数据对比分析具有现实意义;④热点图符合视域的等级划分,眼动轨迹主要集中在最佳视域区域。通过构建的人机布局优化模型得出的布局方案和信息显示优化策略进行人机界面设计,有助于促使调度员注意力合理分配,提升调度员的任务绩效,为人机界面优化设计提供参考。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于NFBMS创新设计综合模型的上肢康复产品设计研究
李晓英, 杨林, 王星达, 闫洛创, 唐毅
2025, 46(1): 211-220.  DOI: 10.11996/JG.j.2095-302X.2025010211
HTML    PDF 24     17

为提升上肢康复训练产品的实用性和合理性,提出功能-行为-结构(FBS)模型拓展,以上肢康复动作特征为出发点,融入用户需求和康复动作构建了基于需求-功能-行为-动作-结构(NFBMS)的上肢康复产品设计模型。通过用户调研建立需求指标评价体系,运用熵权法对用户需求进行优先级排序;以NFBMS模型为设计框架开展设计解耦,并结合上肢康复动作,系统分析上肢康复产品概念模型映射过程,对映射结果执行设计结构矩阵(DSM)聚类求解,建立上肢康复产品功构耦合方法,为脑卒中患者设计一款可穿戴的上肢康复设备;使用NX12.0软件进行运动学仿真分析,验证上肢康复产品机构的合理性。研究表明:基于NFBMS模型与运动学仿真相结合的方法提升了上肢康复设备的功能结构,为同类产品的创新设计提供新思路。

数据和表 | 参考文献 | 相关文章 | 计量指标
基于深度学习的电影海报视觉互动意义评价方法
汪颜, 张牧雨, 刘秀珍
2025, 46(1): 221-232.  DOI: 10.11996/JG.j.2095-302X.2025010221
HTML    PDF 41     27

近年来,应用深度学习技术进行图像美学智能评价已成为一种趋势,然而,高层级美学描述任务所需标注数据量有待增加,数据集标注质量与多样性也有待提高。为此,以视觉语法的互动意义为切入点,引入深度卷积神经网络对电影海报视觉互动意义进行评价研究。首先,使用分词工具从电影海报评议学术文献中提取视觉互动意义核心语义,并借助形态分析法,归纳出视觉互动意义与电影海报特征元素的映射关系;然后,收集优秀电影海报作品,结合专家评议,构建电影海报视觉互动意义评价数据集;最后,运用深度卷积神经网络对电影海报样本进行特征提取,建立电影海报视觉互动意义评价模型,并通过实践创作验证模型的可行性。该方法将计算机美学评价拓展到电影海报设计领域,模拟人类视觉及审美思维,构建客观的评价模型,为设计师提供更加精准的用户审美需求并为前瞻性的设计提供参考。

数据和表 | 参考文献 | 相关文章 | 计量指标
眼控速度与目标移动距离对用户交互绩效的影响
张婷, 赖建都, 侯冠华, 张晶晶
2025, 46(1): 233-240.  DOI: 10.11996/JG.j.2095-302X.2025010233
HTML    PDF 20     7

眼控交互作为一种具有自然交互特性的人机交互方式,能够使用户通过眼睛的运动实现方便快速的实时操作。现有眼控研究多集中在不同轨迹中的匀速绩效比较,与理想眼控交互实际应用还有一定差距。为探究眼控交互环境中不同眼控速度和目标移动距离对用户交互绩效的影响,研究招募23名被试者参与2项眼控实验。实验1采用单因素重复测量实验设计(速度值:2 deg/s,4 deg/s,6 deg/s,8 deg/s),通过采集任务完成时间和准确率等数据评估不同速度值的交互绩效和用户体验;实验2采用2(速度:匀速、变速)×3(距离:短距、中距、长距)的双因素重复测量实验设计,进一步比较不同眼控距离下匀速和变速的交互性能差异。每位被试者分别在不同速度条件下使用眼睛控制目标移动一定距离。结果表明,用户使用眼睛控制目标进行交互时,6 deg/s是舒适的眼控匀速速度,并在短距或中距的交互中绩效明显更佳;然而,在长距离中变速的眼控交互绩效优于匀速。发现表明速度和距离的交互效应会对眼控交互绩效产生不同影响,可为设计师在眼控速度和目标移动距离参数设计中提供指导,从而改善眼控交互体验。

数据和表 | 参考文献 | 相关文章 | 计量指标
本期样刊
2025年第1期样刊
2025, 46(1): 241-241. 
PDF 11     61
相关文章 | 计量指标