Cross-Method Comparison · experiment detail
2026-04-22 23:58:00 UTC

buttom.jpg Multi-Method Probe

把同一张真实开关图分别送进 `PhysX-Anything / PartPacker / OmniPart / PAct / SINGAPO / TRELLIS2`。这页集中展示 bug 修复后的真实运行结果,包括 `TRELLIS2` 的 plain-mesh 导出修复、`PAct` 的 NaN-safe articulation 修复、以及 `OmniPart` 的本地依赖兼容修复。

comparisonreal-imagebuttonswitchPhysX-AnythingPartPackerOmniPartPActSINGAPOTRELLIS2
2026-04-22 23:58:00 UTCTimestamp
6Assets
activeStatus
buttom.jpg Multi-Method Probe cover image
Assets
Interactive Asset

PhysX-Anything

官方四段链直接处理 `buttom.jpg`。这次是一个很漂亮的成功例:模型将其识别为 `Wall Switch`,拆成 `Switch / Base Body` 两个 part,并预测出一个 `B` 型平移组。

2predicted parts
1predicted joints
Electrical Control Devicecategory
PhysX-Anything Input real image
Input real image
PhysX-Anything official sample.glb
这是 PhysX-Anything 官方 decoder + split + sim-ready 的完整输出。该例最终包含 1 个 `B` 型滑动组,对应 switch 相对底板的按压/切换方向。
Interactive Asset

PartPacker

将同一张 `buttom.jpg` 送入 PartPacker 官方 flow 推理。正式链导出完整 `GLB`,并分出 `3` 个 visible parts 和 `2` 个 dual-volume 视图。

3predicted parts
50 / 384steps / grid
officialflow config
PartPacker Input image
Input image
PartPacker full object
默认展示 PartPacker 的完整物体 GLB。下方保留 3 个 part GLB 和 2 个 volume GLB,可以直接观察它对开关这类小物体的几何分解粒度。
Interactive Asset

OmniPart

这条链在本地修掉了 `spaces / RMBG / detectron2` 依赖问题后成功跑通。对 `buttom.jpg`,OmniPart 导出了 textured 与 segmented 两个 GLB,并预测出 `3` 个 3D bbox。

3predicted bboxes
local fixesruntime status
mask-conditionedinput mode
OmniPart Input real image
Input real image
OmniPart Input image + mask visualization
Input image + mask visualization
OmniPart textured mesh
默认展示 OmniPart 的 textured mesh。这里用的是带 alpha 的 bridge 输入,因此它代表的是本地兼容修复后的成功运行,而不是纯原始 RGB 零前处理模式。
Interactive Asset

PAct

这次 `PAct` 不仅成功,而且受益于前面修过的 `NaN-safe articulation`。我们用桥接 mask 走官方推理,最终导出 `2` 节点 articulated object,并补出了 3D bbox、运动树和关节动画。

2predicted nodes
fixed / revolutejoint types
NaN-safe fixedbug fix status
PAct Input real image
Input real image
PAct Bridge mask overlay
Bridge mask overlay
PAct Merged part mask
Merged part mask
PAct PAct conditioning grid
PAct conditioning grid
PAct Predicted 3D bounding boxes
Predicted 3D bounding boxes
PAct Predicted kinematic tree
Predicted kinematic tree
Joint motion animation rendered from object.json
PAct assembled object
默认展示从 `object.json + part_i.glb` 装配出的完整物体。这里的结构是 `base + revolute switch-like part`,语义不一定精确,但结构输出很完整。
Interactive Asset

SINGAPO

SINGAPO 是 graph-conditioned articulated generation,所以这里用了一个很小的人工 graph prior:`base + knob`。模型成功导出了 2 节点结构和 3D bbox。

2predicted nodes
fixed / revolutejoint types
graph-conditionedinput mode
SINGAPO Input real image
Input real image
SINGAPO Generated kinematic tree
Generated kinematic tree
SINGAPO 3D bbox rendering
3D bbox rendering
SINGAPO 3D bbox structure
这里展示的是结构 bbox,不是完整纹理 mesh。对这类小开关物体,SINGAPO 的 graph-conditioned 路线能稳定给出一个很干净的二节点结构。
Interactive Asset

TRELLIS2

这次 `TRELLIS2` 直接走单图 3D,并且修掉了原来 textured GLB 导出易挂住的问题。现在它会额外导出 `plain mesh GLB/OBJ`,所以 `buttom.jpg` 这条链已经能稳定给出最终 3D 结果。

plain meshexport mode
patchedbug fix status
1final glb
TRELLIS2 Input real image
Input real image
TRELLIS2 plain mesh GLB
这里展示的是 patched plain-mesh 导出结果。它不是带材质的 final textured GLB,但已经足够稳定地进入 portal 查看和下载。