图学学报 ›› 2025, Vol. 46 ›› Issue (1): 221-232.DOI: 10.11996/JG.j.2095-302X.2025010221
收稿日期:
2024-05-23
接受日期:
2024-09-29
出版日期:
2025-02-28
发布日期:
2025-02-14
通讯作者:
刘秀珍(1972-),女,副教授,硕士。主要研究方向为数字媒体与交互设计、智能创新应用设计与评价等。E-mail:361692234@qq.com第一作者:
汪颜(1997-),女,硕士研究生。主要研究方向为交互媒体设计。E-mail:ahnahnbibi@foxmail.com
基金资助:
WANG Yan(), ZHANG Muyu, LIU Xiuzhen(
)
Received:
2024-05-23
Accepted:
2024-09-29
Published:
2025-02-28
Online:
2025-02-14
Contact:
LIU Xiuzhen (1972-), associate professor, master. Her main research interests cover digital media and interaction design, intelligent innovative application design and evaluation, etc. E-mail:361692234@qq.comFirst author:
WANG Yan (1997-), master student. Her main research interest covers interactive media design. E-mail:ahnahnbibi@foxmail.com
Supported by:
摘要:
近年来,应用深度学习技术进行图像美学智能评价已成为一种趋势,然而,高层级美学描述任务所需标注数据量有待增加,数据集标注质量与多样性也有待提高。为此,以视觉语法的互动意义为切入点,引入深度卷积神经网络对电影海报视觉互动意义进行评价研究。首先,使用分词工具从电影海报评议学术文献中提取视觉互动意义核心语义,并借助形态分析法,归纳出视觉互动意义与电影海报特征元素的映射关系;然后,收集优秀电影海报作品,结合专家评议,构建电影海报视觉互动意义评价数据集;最后,运用深度卷积神经网络对电影海报样本进行特征提取,建立电影海报视觉互动意义评价模型,并通过实践创作验证模型的可行性。该方法将计算机美学评价拓展到电影海报设计领域,模拟人类视觉及审美思维,构建客观的评价模型,为设计师提供更加精准的用户审美需求并为前瞻性的设计提供参考。
中图分类号:
汪颜, 张牧雨, 刘秀珍. 基于深度学习的电影海报视觉互动意义评价方法[J]. 图学学报, 2025, 46(1): 221-232.
WANG Yan, ZHANG Muyu, LIU Xiuzhen. Visual interactive meaning evaluation method of movie posters based on deep learning[J]. Journal of Graphics, 2025, 46(1): 221-232.
结构 | 形态分类 | 编号 | |||||
---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | ||
媒介层 | 色系L1 | 暖色系 | 冷色系 | - | - | - | - |
饱和度L2 | 高饱和 | 低饱和 | - | - | - | - | |
明度L3 | 明度高 | 明度低 | - | - | - | - | |
图像内容L4 | 人物正面 | 人物侧面 | 人物背面 | 静物 | 自然环境 | 无图像 | |
景别L5 | 特写 | 近景 | 中景 | 远景 | 全景 | - | |
技艺层 | 表现手法L6 | 抽象 | 具象 | 夸张 | 变形 | 透视 | 对比 |
布局结构L7 | 满版型 | 对称型 | 分割型 | 倾斜型 | 曲线型 | 重心型 |
表1 电影海报形态解构编码矩阵
Table 1 Movie poster form deconstruction coding matrix
结构 | 形态分类 | 编号 | |||||
---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | ||
媒介层 | 色系L1 | 暖色系 | 冷色系 | - | - | - | - |
饱和度L2 | 高饱和 | 低饱和 | - | - | - | - | |
明度L3 | 明度高 | 明度低 | - | - | - | - | |
图像内容L4 | 人物正面 | 人物侧面 | 人物背面 | 静物 | 自然环境 | 无图像 | |
景别L5 | 特写 | 近景 | 中景 | 远景 | 全景 | - | |
技艺层 | 表现手法L6 | 抽象 | 具象 | 夸张 | 变形 | 透视 | 对比 |
布局结构L7 | 满版型 | 对称型 | 分割型 | 倾斜型 | 曲线型 | 重心型 |
维度 | 分类 | 关键形态 | 电影海报特征编码 |
---|---|---|---|
接触 | 索取 | L4 | L4 (1) |
提供 | L4 (2),L4 (3),L4 (4), L4 (5),L4 (6) | ||
距离 | 近距离 | L5 | L5 (1),L5 (2),L5 (3) |
远距离 | L5 (4),L5 (5) | ||
视角 | 仰视视角 | L6,L7 | L6 (3),L6 (4),L7 (4) |
平视视角 | L6 (2),L7 (1),L7 (6) | ||
俯视视角 | L6 (3),L6 (4),L7 (4) | ||
情态 | 高情态 | L1,L2,L3 | L1 (1),L2 (1),L3 (1) |
低情态 | L1 (2),L2 (2),L3 (2) |
表2 形态特征元素与视觉互动意义四维度的映射关系
Table 2 The four-dimensional mapping relationship between morphological characteristic elements and visual interactive meaning
维度 | 分类 | 关键形态 | 电影海报特征编码 |
---|---|---|---|
接触 | 索取 | L4 | L4 (1) |
提供 | L4 (2),L4 (3),L4 (4), L4 (5),L4 (6) | ||
距离 | 近距离 | L5 | L5 (1),L5 (2),L5 (3) |
远距离 | L5 (4),L5 (5) | ||
视角 | 仰视视角 | L6,L7 | L6 (3),L6 (4),L7 (4) |
平视视角 | L6 (2),L7 (1),L7 (6) | ||
俯视视角 | L6 (3),L6 (4),L7 (4) | ||
情态 | 高情态 | L1,L2,L3 | L1 (1),L2 (1),L3 (1) |
低情态 | L1 (2),L2 (2),L3 (2) |
视觉互动意义四维度 | 分类 | 初级评价语义 |
---|---|---|
接触 | 索取 | 有目光的、共情的 |
提供 | 旁观者视角的、叙事的 | |
距离 | 近距离 | 亲近的、特写的 |
远距离 | 疏远的、空间感的 | |
视角 | 仰视视角 | 强势的、高大的 |
平视视角 | 平等的、亲切的 | |
俯视视角 | 弱势的、渺小的 | |
情态 | 高情态 | 激情的、热烈的 |
低情态 | 灰暗的、冷淡的 |
表3 电影海报视觉互动意义数据集的初级评价语义库
Table 3 The primary evaluation semantic library of movie poster visual interactive meaning dataset
视觉互动意义四维度 | 分类 | 初级评价语义 |
---|---|---|
接触 | 索取 | 有目光的、共情的 |
提供 | 旁观者视角的、叙事的 | |
距离 | 近距离 | 亲近的、特写的 |
远距离 | 疏远的、空间感的 | |
视角 | 仰视视角 | 强势的、高大的 |
平视视角 | 平等的、亲切的 | |
俯视视角 | 弱势的、渺小的 | |
情态 | 高情态 | 激情的、热烈的 |
低情态 | 灰暗的、冷淡的 |
参数 | 样本序号 | ||||||||
---|---|---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |
图像 | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
评议1 | 有目光的 | 旁观者视角的 | 亲近的 | 疏远的 | 强势的 | 平等的 | 弱势的 | 激情的 | 灰暗的 |
评议2 | 共情的 | 叙事的 | 特写的 | 空间感的 | 高大的 | 亲切的 | 渺小的 | 热烈的 | 冷淡的 |
表4 测试样本与对应的评价语义
Table 4 Test samples and corresponding evaluation semantics
参数 | 样本序号 | ||||||||
---|---|---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |
图像 | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
评议1 | 有目光的 | 旁观者视角的 | 亲近的 | 疏远的 | 强势的 | 平等的 | 弱势的 | 激情的 | 灰暗的 |
评议2 | 共情的 | 叙事的 | 特写的 | 空间感的 | 高大的 | 亲切的 | 渺小的 | 热烈的 | 冷淡的 |
参数 | 题目序号 | ||||||||
---|---|---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |
α | 0.848 | 0.846 | 0.845 | 0.845 | 0.850 | 0.848 | 0.839 | 0.844 | 0.842 |
参数 | 题目序号 | ||||||||
10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | |
α | 0.843 | 0.845 | 0.851 | 0.839 | 0.852 | 0.850 | 0.843 | 0.848 | 0.844 |
表5 “电影海报评价语义匹配度”问卷信度分析结果
Table 5 Reliability analysis results of the questionnaire “Movie Poster Evaluation Semantic Matching Degree”
参数 | 题目序号 | ||||||||
---|---|---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |
α | 0.848 | 0.846 | 0.845 | 0.845 | 0.850 | 0.848 | 0.839 | 0.844 | 0.842 |
参数 | 题目序号 | ||||||||
10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | |
α | 0.843 | 0.845 | 0.851 | 0.839 | 0.852 | 0.850 | 0.843 | 0.848 | 0.844 |
得分 | 评价语义 | ||||||||
---|---|---|---|---|---|---|---|---|---|
有目光的 | 共情的 | 旁观者视角的 | 叙事的 | 亲近的 | 特写的 | 疏远的 | 空间感的 | 强势的 | |
平均分 | 3.33 | 2.97 | 3.07 | 3.00 | 4.27 | 3.74 | 2.63 | 3.55 | 3.70 |
得分 | 评价语义 | ||||||||
高大的 | 平等的 | 亲切的 | 弱势的 | 渺小的 | 激情的 | 热烈的 | 灰暗的 | 冷淡的 | |
平均分 | 3.69 | 3.02 | 2.88 | 2.32 | 3.23 | 4.09 | 3.69 | 3.91 | 3.16 |
表6 评价语义得分均值
Table 6 The mean score of the evaluation semantics
得分 | 评价语义 | ||||||||
---|---|---|---|---|---|---|---|---|---|
有目光的 | 共情的 | 旁观者视角的 | 叙事的 | 亲近的 | 特写的 | 疏远的 | 空间感的 | 强势的 | |
平均分 | 3.33 | 2.97 | 3.07 | 3.00 | 4.27 | 3.74 | 2.63 | 3.55 | 3.70 |
得分 | 评价语义 | ||||||||
高大的 | 平等的 | 亲切的 | 弱势的 | 渺小的 | 激情的 | 热烈的 | 灰暗的 | 冷淡的 | |
平均分 | 3.69 | 3.02 | 2.88 | 2.32 | 3.23 | 4.09 | 3.69 | 3.91 | 3.16 |
视觉互动意义四维度 | 分类 | 最终语义评议 |
---|---|---|
接触 | 索取 | 有目光的 |
提供 | 旁观者视角的、叙事的 | |
距离 | 近距离 | 亲近的、特写的 |
远距离 | 空间感的 | |
视角 | 仰视视角 | 强势的、高大的 |
平视视角 | 平等的 | |
俯视视角 | 渺小的 | |
情态 | 高情态 | 激情的、热烈的 |
低情态 | 灰暗的、冷淡的 |
表7 电影海报视觉互动意义数据集的最终评价语义库
Table 7 The final evaluation semantic library of movie poster visual interactive meaning dataset
视觉互动意义四维度 | 分类 | 最终语义评议 |
---|---|---|
接触 | 索取 | 有目光的 |
提供 | 旁观者视角的、叙事的 | |
距离 | 近距离 | 亲近的、特写的 |
远距离 | 空间感的 | |
视角 | 仰视视角 | 强势的、高大的 |
平视视角 | 平等的 | |
俯视视角 | 渺小的 | |
情态 | 高情态 | 激情的、热烈的 |
低情态 | 灰暗的、冷淡的 |
样本编号 | 专家 | 最终分类 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
P1 | P2 | P3 | P4 | P5 | P6 | P7 | P8 | P9 | P10 | ||
tt0085656 | F | F | F | F | F | F | C | F | F | C | F |
tt0086525 | D | O | D | D | D | D | O | D | D | D | D |
tt0088011 | HA | HA | E | HA | HA | HA | HA | HA | HA | HA | HA |
tt0089893 | F | F | F | C | F | F | F | C | F | F | F |
tt0089560 | D | D | D | D | D | D | D | D | D | D | D |
tt0093690 | H | H | H | H | E | E | H | H | H | H | H |
tt0115493 | LA | LA | LA | E | LA | LA | LA | E | LA | LA | LA |
tt0115012 | E | E | LA | LA | LA | LA | LA | LA | LA | LA | LA |
tt0116165 | E | E | E | E | E | E | E | E | E | E | E |
tt0118870 | O | O | O | O | D | O | O | O | O | O | O |
tt0115994 | E | H | E | E | E | E | E | E | E | E | E |
tt0086346 | F | C | C | C | C | F | C | C | C | C | C |
tt0116346 | LM | LH | LM | LM | LH | LM | LM | LM | LM | LM | LM |
表8 电影海报视觉互动意义评价分类结果示例
Table 8 Example of evaluation classification results for the visual interactive meaning of movie posters
样本编号 | 专家 | 最终分类 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
P1 | P2 | P3 | P4 | P5 | P6 | P7 | P8 | P9 | P10 | ||
tt0085656 | F | F | F | F | F | F | C | F | F | C | F |
tt0086525 | D | O | D | D | D | D | O | D | D | D | D |
tt0088011 | HA | HA | E | HA | HA | HA | HA | HA | HA | HA | HA |
tt0089893 | F | F | F | C | F | F | F | C | F | F | F |
tt0089560 | D | D | D | D | D | D | D | D | D | D | D |
tt0093690 | H | H | H | H | E | E | H | H | H | H | H |
tt0115493 | LA | LA | LA | E | LA | LA | LA | E | LA | LA | LA |
tt0115012 | E | E | LA | LA | LA | LA | LA | LA | LA | LA | LA |
tt0116165 | E | E | E | E | E | E | E | E | E | E | E |
tt0118870 | O | O | O | O | D | O | O | O | O | O | O |
tt0115994 | E | H | E | E | E | E | E | E | E | E | E |
tt0086346 | F | C | C | C | C | F | C | C | C | C | C |
tt0116346 | LM | LH | LM | LM | LH | LM | LM | LM | LM | LM | LM |
名称 | 软硬件环境 |
---|---|
操作系统 | MacOS Catalina 10.15.5 |
CPU | Intel(R) Core(TM) i7-9750H CPU @2.60 GHz |
内存 | 16 GB 2400 MHz DDR4 |
编程语言 | Python 3.9 |
卷积神经网络 | Inception-ResNet-v2 |
表9 实验环境
Table 9 Experimental setup
名称 | 软硬件环境 |
---|---|
操作系统 | MacOS Catalina 10.15.5 |
CPU | Intel(R) Core(TM) i7-9750H CPU @2.60 GHz |
内存 | 16 GB 2400 MHz DDR4 |
编程语言 | Python 3.9 |
卷积神经网络 | Inception-ResNet-v2 |
维度 | 训练集样本/张 | 测试集样本/张 |
---|---|---|
接触 | 索取(601)、提供(593) | 200 |
距离 | 近距离(612)、远距离(605) | 200 |
视角 | 仰视视角(413)、平视视角(557)、 俯视视角(420) | 250 |
情态 | 高情态(624)、低情态(626) | 200 |
表10 4种维度的训练集与测试集分布
Table 10 Distribution of training set and test set in four dimensions
维度 | 训练集样本/张 | 测试集样本/张 |
---|---|---|
接触 | 索取(601)、提供(593) | 200 |
距离 | 近距离(612)、远距离(605) | 200 |
视角 | 仰视视角(413)、平视视角(557)、 俯视视角(420) | 250 |
情态 | 高情态(624)、低情态(626) | 200 |
维度 | 模型输出结果 | 分类 | 正确评价数/张 | 实际样本数/张 | 测试准确率/% | 综合准确率/% |
---|---|---|---|---|---|---|
接触 | ![]() | 提供 | 91 | 112 | 81.3 | 76.5 |
索取 | 62 | 88 | 70.5 | |||
距离 | ![]() | 近距离 | 97 | 104 | 93.3 | 90.5 |
远距离 | 84 | 96 | 87.5 | |||
视角 | ![]() | 仰视视角 | 54 | 79 | 65.8 | 72.4 |
平视视角 | 75 | 99 | 75.8 | |||
俯视视角 | 52 | 72 | 72.2 | |||
情态 | ![]() | 高情态 | 89 | 98 | 90.8 | 93.5 |
低情态 | 98 | 102 | 96.1 |
表11 4种维度评价准确率对比表
Table 11 Comparison table of evaluation accuracy rates in four dimensions
维度 | 模型输出结果 | 分类 | 正确评价数/张 | 实际样本数/张 | 测试准确率/% | 综合准确率/% |
---|---|---|---|---|---|---|
接触 | ![]() | 提供 | 91 | 112 | 81.3 | 76.5 |
索取 | 62 | 88 | 70.5 | |||
距离 | ![]() | 近距离 | 97 | 104 | 93.3 | 90.5 |
远距离 | 84 | 96 | 87.5 | |||
视角 | ![]() | 仰视视角 | 54 | 79 | 65.8 | 72.4 |
平视视角 | 75 | 99 | 75.8 | |||
俯视视角 | 52 | 72 | 72.2 | |||
情态 | ![]() | 高情态 | 89 | 98 | 90.8 | 93.5 |
低情态 | 98 | 102 | 96.1 |
图10 “视角”分类的样本增强处理示例((a)初始样本;(b)样本增强处理效果)
Fig. 10 Example of sample enhancement processing for “View” classification ((a) Initial sample; (b) Sample enhancement effect)
作品 | 序号 | ||||||||
---|---|---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |
原创 海报 | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
表12 原创海报作品
Table 12 Original poster work
作品 | 序号 | ||||||||
---|---|---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |
原创 海报 | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
维度 | 模型输出结果 | 分类 | 样本数量/张 | 正确评价数量/张 | 识别准确率/% | 综合准确率/% |
---|---|---|---|---|---|---|
接触 | ![]() | 提供 | 18 | 12 | 66.7 | 72.0 |
索取 | 32 | 24 | 75.5 | |||
距离 | ![]() | 近距离 | 36 | 30 | 83.3 | 82.0 |
远距离 | 14 | 11 | 78.6 |
表13 “接触”与“距离”分类评价模型预测结果
Table 13 Prediction results of “Contact” and “Distance” classification evaluation model
维度 | 模型输出结果 | 分类 | 样本数量/张 | 正确评价数量/张 | 识别准确率/% | 综合准确率/% |
---|---|---|---|---|---|---|
接触 | ![]() | 提供 | 18 | 12 | 66.7 | 72.0 |
索取 | 32 | 24 | 75.5 | |||
距离 | ![]() | 近距离 | 36 | 30 | 83.3 | 82.0 |
远距离 | 14 | 11 | 78.6 |
维度 | 模型输出结果 | 分类 | 样本数量/张 | 正确评价数量/张 | 识别准确率/% | 综合准确率/% |
---|---|---|---|---|---|---|
视角 | ![]() ![]() | 仰视视角 | 13 | 8 | 61.5 | 66.7 |
平视视角 | 33 | 23 | 69.7 | |||
俯视视角 | 14 | 9 | 64.2 | |||
情态 | ![]() | 高情态 | 26 | 21 | 80.7 | 81.7 |
低情态 | 34 | 28 | 82.3 |
表14 “视角”与“情态”分类评价模型预测结果
Table 14 Prediction results of “View” and “Modal” classification evaluation model
维度 | 模型输出结果 | 分类 | 样本数量/张 | 正确评价数量/张 | 识别准确率/% | 综合准确率/% |
---|---|---|---|---|---|---|
视角 | ![]() ![]() | 仰视视角 | 13 | 8 | 61.5 | 66.7 |
平视视角 | 33 | 23 | 69.7 | |||
俯视视角 | 14 | 9 | 64.2 | |||
情态 | ![]() | 高情态 | 26 | 21 | 80.7 | 81.7 |
低情态 | 34 | 28 | 82.3 |
[1] | KONG S, SHEN X H, LIN Z, et al. Photo aesthetics ranking network with attributes and content adaptation[C]// The 14th European Conference on Computer Vision. Cham: Springer, 2016: 662-679. |
[2] | 周坤, 张曦, 肖定坤, 等. 基于深度学习的界面设计美学评价研究[J]. 包装工程, 2020, 41(12): 207-215. |
ZHOU K, ZHANG X, XIAO D K, et al. Aesthetic evaluation of interface design based on deep learning[J]. Packaging Engineering, 2020, 41(12): 207-215 (in Chinese). | |
[3] | CHANG K Y, LU K H, CHEN C S. Aesthetic critiques generation for photos[C]// 2017 IEEE International Conference on Computer Vision. New York: IEEE Press, 2017: 3534-3543. |
[4] |
金鑫, 周彬, 邹冬青, 等. 图像美学质量评价技术发展趋势[J]. 科技导报, 2018, 36(9): 36-45.
DOI |
JIN X, ZHOU B, ZOU D Q, et al. Image aesthetic quality assessment: a survey[J]. Science & Technology Review, 2018, 36(9): 36-45 (in Chinese). | |
[5] | HOSSAIN N, AHAMAD M M, AKTAR S, et al. Movie genre classification with deep neural network using poster images[C]// 2021 International Conference on Information and Communication Technology for Sustainable Development. New York: IEEE Press, 2021: 195-199. |
[6] | 李硕. 基于图像信息挖掘的电影推荐算法研究[D]. 长春: 吉林大学, 2020. |
LI S. Research on movie recommendation algorithm based on image information mining[D]. Changchun: Jilin University, 2020 (in Chinese). | |
[7] | KRESS G, VAN LEEUWEN T. Reading images: the grammar of visual design[M]. London: Routledge, 2006: 45-214. |
[8] | 王硕, 尹富林. 视觉语法观照下的多模态语篇分析—以一则平面广告为例[J]. 南京工业大学学报(社会科学版), 2011, 10(4): 96-100. |
WANG S, YIN F L. Multimodal advertising discourse analysis from the perspective of visual grammar[J]. Journal of Nanjing Tech University (Social Science Edition), 2011, 10(4): 96-100 (in Chinese). | |
[9] | 宗杰, 赵卫国, 张振江, 等. 基于神经网络的产品文化符号意象认知评价方法研究[J]. 包装工程, 2021, 42(8): 261-267. |
ZONG J, ZHAO W G, ZHANG Z J, et al. Image cognitive evaluation method of product cultural symbols based on neural network[J]. Packaging Engineering, 2021, 42(8): 261-267 (in Chinese). | |
[10] | 曾栋, 周砖. 基于层次化的产品触感评价方法与应用[J]. 包装工程, 2019, 40(18): 123-128, 134. |
ZENG D, ZHOU Z. Evaluation method and application of product tactile perception based on hierarchical structure[J]. Packaging Engineering, 2019, 40(18): 123-128, 134 (in Chinese). | |
[11] | 魏毅东. 论艺术作品的多层次结构[J]. 东南大学学报(哲学社会科学版), 2008, 10(6): 83-88. |
WEI Y D. An analysis of the multi-level structure of artistic works[J]. Journal of Southeast University (Philosophy and Social Science), 2008, 10(6): 83-88 (in Chinese). | |
[12] | 江艳艳. 视觉艺术的具身性多模态话语的认知路径[J]. 牡丹江大学学报, 2019, 28(11): 25-30. |
JIANG Y Y. The cognitive path of multimodal discourse: the embodiment of art[J]. Journal of Mudanjiang University, 2019, 28(11): 25-30 (in Chinese). | |
[13] | 李彦龙, 蔡谦, 孙久康, 等. 基于BP神经网络的汽车外观设计评价方法[J]. 同济大学学报(自然科学版), 2021, 49(1): 116-123. |
LI Y L, CAI Q, SUN J K, et al. An evaluation method of vehicle exterior design based on BP neural network[J]. Journal of Tongji University (Natural Science Edition), 2021, 49(1): 116-123 (in Chinese). | |
[14] | 姚干勤, 薛澄岐. 产品造型风格意象认知空间构建方法研究[J]. 包装工程, 2018, 39(12): 100-106. |
YAO G Q, XUE C Q. Methods of constructing the cognitive space of product styling image[J]. Packaging Engineering, 2018, 39(12): 100-106 (in Chinese). | |
[15] | 黄佳美, 张伟彬, 熊官送. 基于深度卷积神经网络的汽车图像分类算法与加速研究[J]. 现代电子技术, 2024, 47(7): 140-144. |
HUANG J M, ZHANG W B, XIONG G S. Research on automobile image classification algorithm and acceleration based on deep convolutional neural network[J]. Modern Electronics Technique, 2024, 47(7): 140-144 (in Chinese). | |
[16] |
毕春艳, 刘越. 基于深度学习的视频人体动作识别综述[J]. 图学学报, 2023, 44(4): 625-639.
DOI |
BI C Y, LIU Y. A survey of video human action recognition based on deep learning[J]. Journal of Graphics, 2023, 44(4): 625-639 (in Chinese). | |
[17] | 熊强, 郑建华. 基于机器学习的平面公益广告效果评价研究[J]. 包装工程, 2023, 44(20): 451-459. |
XIONG Q, ZHENG J H. Effect evaluation of plane public service advertisement based on machine learning[J]. Packaging Engineering, 2023, 44(20): 451-459 (in Chinese). | |
[18] |
邵俊棋, 钱文华, 徐启豪. 基于条件残差生成对抗网络的风景图生成[J]. 图学学报, 2023, 44(4): 710-717.
DOI |
SHAO J Q, QIAN W H, XU Q H. Landscape image generation based on conditional residual generative adversarial network[J]. Journal of Graphics, 2023, 44(4): 710-717 (in Chinese). |
[1] | 李琼, 考月英, 张莹, 徐沛. 面向无人机航拍图像的目标检测研究综述[J]. 图学学报, 2024, 45(6): 1145-1164. |
[2] | 刘灿锋, 孙浩, 东辉. 结合Transformer与Kolmogorov Arnold网络的分子扩增时序预测研究[J]. 图学学报, 2024, 45(6): 1256-1265. |
[3] | 宋思程, 陈辰, 李晨辉, 王长波. 基于密度图多目标追踪的时空数据可视化[J]. 图学学报, 2024, 45(6): 1289-1300. |
[4] | 王宗继, 刘云飞, 陆峰. Cloud Sphere: 一种基于渐进式变形自编码的三维模型表征方法[J]. 图学学报, 2024, 45(6): 1375-1388. |
[5] | 许丹丹, 崔勇, 张世倩, 刘雨聪, 林予松. 优化医学影像三维渲染可视化效果:技术综述[J]. 图学学报, 2024, 45(5): 879-891. |
[6] | 胡凤阔, 叶兰, 谭显峰, 张钦展, 胡志新, 方清, 王磊, 满孝锋. 一种基于改进YOLOv8的轻量化路面病害检测算法[J]. 图学学报, 2024, 45(5): 892-900. |
[7] | 刘义艳, 郝婷楠, 贺晨, 常英杰. 基于DBBR-YOLO的光伏电池表面缺陷检测[J]. 图学学报, 2024, 45(5): 913-921. |
[8] | 翟永杰, 李佳蔚, 陈年昊, 王乾铭, 王新颖. 融合改进Transformer的车辆部件检测方法[J]. 图学学报, 2024, 45(5): 930-940. |
[9] | 姜晓恒, 段金忠, 卢洋, 崔丽莎, 徐明亮. 融合先验知识推理的表面缺陷检测[J]. 图学学报, 2024, 45(5): 957-967. |
[10] | 熊超, 王云艳, 罗雨浩. 特征对齐与上下文引导的多视图三维重建[J]. 图学学报, 2024, 45(5): 1008-1016. |
[11] | 胡欣, 常娅姝, 秦皓, 肖剑, 程鸿亮. 基于改进YOLOv8和GMM图像点集匹配的双目测距方法[J]. 图学学报, 2024, 45(4): 714-725. |
[12] | 牛为华, 郭迅. 基于改进YOLOv8的船舰遥感图像旋转目标检测算法[J]. 图学学报, 2024, 45(4): 726-735. |
[13] | 李滔, 胡婷, 武丹丹. 结合金字塔结构和注意力机制的单目深度估计[J]. 图学学报, 2024, 45(3): 454-463. |
[14] | 朱光辉, 缪君, 胡宏利, 申基, 杜荣华. 基于自增强注意力机制的室内单图像分段平面三维重建[J]. 图学学报, 2024, 45(3): 464-471. |
[15] | 王稚儒, 常远, 鲁鹏, 潘成伟. 神经辐射场加速算法综述[J]. 图学学报, 2024, 45(1): 1-13. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||