把同一张真实椅子图分别送进 `PhysX-Anything / PartPacker / OmniPart / PAct / SINGAPO / TRELLIS2`。这页把各方法的真实输出并排放在一起,同时明确写出每条链是否需要额外 mask、graph prior,或在哪个阶段失败。
官方四段链直接处理 `chair_real.jpg`。结果将其识别为 `Swivel Chair`,拆成 `Backrest / Seat / Pedestal` 三个静态 part,并导出 `sample.glb + basic.urdf + basic.xml`。
直接将同一张 `chair_real.jpg` 送入 PartPacker 官方 flow 推理。输出了完整 `chair_real_0.glb`,并分出 `2` 个 visible parts 与 `2` 个 dual-volume 视图。
用 `chair_real.jpg` 的桥接 mask 作为条件,走 OmniPart 的 bbox + part synthesis 链。结果导出了 textured 和 segmented 两个 GLB,并给出了 `9` 个 part bbox。
先用 Appendix-D 风格 `VLM + SAM2` 预处理拿到 `processed.png + mask.exr`,再送入 PAct 官方推理。正式生成成功,最终导出 `11` 个节点、含 `fixed / revolute / prismatic` 的 articulated object。
SINGAPO 本身是 graph-conditioned articulated generation,所以这次对 `chair_real.jpg` 采用了一个贴近椅子的手工 graph prior,再让模型生成结构输出。结果成功导出了树和 3D bbox,但语义明显受限于它的 appliance-style 词表。
这次 chair_real 的 TRELLIS2 尝试采用本地 snapshot 和 shape-only 手工装配链。稀疏结构采样能走完,但 shape-slat 阶段因为 sparse coords 变空而失败,所以没有最终 chair GLB。