摘要:
在 3D 打印、快递物流等领域,需要将形状各异的零件或货物在限定的空间中摆放,称为异形填
充。给出一种摆放方案,以便将尽可能多的多面体放入给定容器;或者一批物体紧密地摆放,使得占用体积最小,
则称为异形填充问题。这是个 NP 问题,很难高效求解。基于此,研究在一个可变维度的三维容器内摆放给定的
一组多面体,使得打包后容器的可变维度最小。并提出一个基于强化学习的算法 AC-HAPE3D,利用启发式算法
HAPE3D 将问题建模为马尔可夫过程,再利用基于策略的强化学习方法 Actor-Critic 进行学习。同时用体素来表
示容器和多面体,从而简化状态信息的表达,并用神经网络表示价值函数和策略函;为了解决状态信息长度以及
动作空间可变的问题,采取遮罩的方法来屏蔽部分输入和输出,并且引入 LSTM 来处理变长的状态信息。在 5 个
不同的数据集进行的实验表明算法能够取得较好的结果。
中图分类号:
朱鹏辉, 袁宏涛, 聂勇伟, 李桂清. AC-HAPE3D:基于强化学习的异形填充算法 [J]. 图学学报, 2022, 43(6): 1096-1103.
ZHU Peng-hui, YUAN Hong-tao, NIE Yong-wei, LI Gui-qing. AC-HAPE3D: an algorithm for irregular packing based on
reinforcement learning[J]. Journal of Graphics, 2022, 43(6): 1096-1103.