Cross-Method Comparison · experiment detail
2026-04-22 23:59:00 UTC

lock.jpg Multi-Method Probe

把同一张真实门锁图分别送进 `PhysX-Anything / PartPacker / OmniPart / PAct / SINGAPO / TRELLIS2`。这页特别适合看方法出域时的差异:`PhysX-Anything` 明确误识别失败,而其余几条链在修复后都给出了可视化结果。

comparisonreal-imagelockdoor-hardwarePhysX-AnythingPartPackerOmniPartPActSINGAPOTRELLIS2
2026-04-22 23:59:00 UTCTimestamp
6Assets
activeStatus
lock.jpg Multi-Method Probe cover image
Assets
Interactive Asset

PhysX-Anything

这次 `PhysX-Anything` 是一个很典型的出域失败例。它把 `lock.jpg` 误识别成了 `Armchair`,停在 stage-1 文本/voxel 语义阶段,没有导出最终 `sample.glb`。

stage-1 failpipeline status
Armchairmisrecognized as
0final glb
PhysX-Anything Input real image
Input real image
PhysX-Anything failure placeholder
这项是诚实展示失败:官方链在 `lock.jpg` 上把门锁误解成扶手椅,因此没有进入后续可用的 articulated 资产导出。
Interactive Asset

PartPacker

将同一张 `lock.jpg` 送入 PartPacker 官方 flow 推理。它成功导出了完整 `GLB`,并分出 `4` 个 visible parts 和 `2` 个 dual-volume 视图。

4predicted parts
50 / 384steps / grid
officialflow config
PartPacker Input image
Input image
PartPacker full object
默认展示 PartPacker 的完整物体 GLB。它对 door hardware 这种局部结构能给出较细的几何分解,但 part 语义仍主要停留在几何块层面。
Interactive Asset

OmniPart

`OmniPart` 在本地兼容修复后也成功跑通。对 `lock.jpg`,它导出了 textured 与 segmented 两个 GLB,并预测出 `10` 个 3D bbox,分解明显更细。

10predicted bboxes
local fixesruntime status
mask-conditionedinput mode
OmniPart Input real image
Input real image
OmniPart Input image + mask visualization
Input image + mask visualization
OmniPart textured mesh
默认展示 OmniPart 的 textured mesh。这里仍然是带 alpha 的 bridge 输入,但它已经能稳定输出 lock hardware 的较细结构。
Interactive Asset

PAct

`PAct` 在 `lock.jpg` 上是这轮里最完整的一条链之一。桥接 mask + 官方推理成功后,导出了 `3` 节点 articulated object,并补出了 3D bbox、运动树和关节动画。

3predicted nodes
fixed / revolutejoint types
NaN-safe fixedbug fix status
PAct Input real image
Input real image
PAct Bridge mask overlay
Bridge mask overlay
PAct Merged part mask
Merged part mask
PAct PAct conditioning grid
PAct conditioning grid
PAct Predicted 3D bounding boxes
Predicted 3D bounding boxes
PAct Predicted kinematic tree
Predicted kinematic tree
Joint motion animation rendered from object.json
PAct assembled object
默认展示从 `object.json + part_i.glb` 装配出的完整物体。这里的结构解释成 `base + 2 revolute pieces`,更像门把手与锁舌机构的近似表达。
Interactive Asset

SINGAPO

SINGAPO 这次用了一个 `base + handle + knob` 的人工 graph prior。它成功导出了 3 节点结构,节点数与 `PAct` 一致,但关节家族是 `fixed / revolute / prismatic`。

3predicted nodes
fixed / rev / prisjoint types
graph-conditionedinput mode
SINGAPO Input real image
Input real image
SINGAPO Generated kinematic tree
Generated kinematic tree
SINGAPO 3D bbox rendering
3D bbox rendering
SINGAPO 3D bbox structure
这里展示的是结构 bbox。对 lock hardware 这种小尺度局部装置,SINGAPO 更像在做带 graph prior 的结构近似,而不是精确恢复真实机械构型。
Interactive Asset

TRELLIS2

`TRELLIS2` 在 `lock.jpg` 上也已经能稳定给出最终 3D 结果。这次依靠 plain-mesh 导出补丁,避开了原来 textured GLB 转换易挂住的问题。

plain meshexport mode
patchedbug fix status
1final glb
TRELLIS2 Input real image
Input real image
TRELLIS2 plain mesh GLB
这里展示的是 patched plain-mesh 导出结果。它不是带材质的 textured 终态,但对 portal 展示和方法比较已经足够稳定可用。