把同一张真实门锁图分别送进 `PhysX-Anything / PartPacker / OmniPart / PAct / SINGAPO / TRELLIS2`。这页特别适合看方法出域时的差异:`PhysX-Anything` 明确误识别失败,而其余几条链在修复后都给出了可视化结果。
这次 `PhysX-Anything` 是一个很典型的出域失败例。它把 `lock.jpg` 误识别成了 `Armchair`,停在 stage-1 文本/voxel 语义阶段,没有导出最终 `sample.glb`。
将同一张 `lock.jpg` 送入 PartPacker 官方 flow 推理。它成功导出了完整 `GLB`,并分出 `4` 个 visible parts 和 `2` 个 dual-volume 视图。
`OmniPart` 在本地兼容修复后也成功跑通。对 `lock.jpg`,它导出了 textured 与 segmented 两个 GLB,并预测出 `10` 个 3D bbox,分解明显更细。
`PAct` 在 `lock.jpg` 上是这轮里最完整的一条链之一。桥接 mask + 官方推理成功后,导出了 `3` 节点 articulated object,并补出了 3D bbox、运动树和关节动画。
SINGAPO 这次用了一个 `base + handle + knob` 的人工 graph prior。它成功导出了 3 节点结构,节点数与 `PAct` 一致,但关节家族是 `fixed / revolute / prismatic`。
`TRELLIS2` 在 `lock.jpg` 上也已经能稳定给出最终 3D 结果。这次依靠 plain-mesh 导出补丁,避开了原来 textured GLB 转换易挂住的问题。