图学学报 ›› 2022, Vol. 43 ›› Issue (2): 333-341.DOI: 10.11996/JG.j.2095-302X.2022020333
摘要: 人体姿态估计是近年来人机交互领域的热点话题。当前,常见的人体姿态估计方法集中在通过增
加网络的复杂性来提高精度,却忽视了模型的效益问题,导致模型在实际应用中精度高但计算资源消耗巨大。针
对这一问题设计了一个基于全局姿态感知的轻量级人体姿态估计模型,其在MSCOCO数据集上精度达68.2% AP,
速度保持在 255 fps,参数量和 FLOPS 仅为 OpenPose 方法的 10%和 0.9%。在人体姿态估计任务中,根据预测的
关键节点数量来设置网络的输出通道数,导致对每个关键点的检测都是独立的。关键点之间的相对位置、整体布
局等全局信息在困难样本的姿态估计任务中非常重要,但是在之前的研究中未考虑到。为了利用全局姿态信息,
设计了一个全局姿态感知模块来提取全局姿态特征,并利用双分支网络融合全局和局部姿态特征。实验表明,利
用全局姿态感知模块的轻量级人体姿态估计网络在 MPII 和 MSCOCO 数据集上精度分别提高了 1.5%和 1.3%。
中图分类号: