
摘要
从原始三维几何数据中重建CAD构造序列,是连接现实世界物体与数字设计之间的关键接口。本文提出一种名为CAD-Diffuser的多模态扩散模型,旨在将自上而下的设计范式融入生成式重建过程。具体而言,我们在标记(token)层面统一了CAD点云与CAD构造序列,从而引导所提出的多模态扩散策略,深入理解并建立几何结构与构造序列中蕴含的设计意图之间的关联。借助语言模型强大的解码能力,前向过程被建模为从原始标记到[MASK]标记之间的随机游走,而反向过程则自然契合掩码标记建模框架。此外,我们设计了一种基于体积的噪声调度机制,以促进“轮廓优先”的生成策略,将自上而下的设计方法论分解为机器可理解的执行步骤。针对多模态CAD数据的标记化处理,我们引入了一种具备自监督面分割任务的标记器,用于压缩CAD点云的局部与全局几何信息;同时,将CAD构造序列转换为基本几何体(primitive)标记序列。实验结果表明,CAD-Diffuser能够有效捕捉几何细节,生成结果更符合人类设计师的使用习惯,具有更高的可重用性。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| cad-reconstruction-on-deepcad | CAD-Diffuser | Camfer Distance (median): 3.02 IoU: 74.3 |
| cad-reconstruction-on-fusion-360-gallery | CAD-Diffuser | Chamfer Distance (median): 3.85 IoU: 63.2 |