Cross-Method Comparison · experiment detail
2026-04-22 23:45:00 UTC

laptop_real.jpg Multi-Method Probe

把同一张真实笔记本图分别送进 `PhysX-Anything / PartPacker / OmniPart / PAct / SINGAPO / TRELLIS2`。这页把各方法的真实输出并排展示,同时明确写出 bridge 条件、graph prior,或具体失败阶段。

comparisonreal-imagelaptopPhysX-AnythingPartPackerOmniPartPActSINGAPOTRELLIS2
2026-04-22 23:45:00 UTCTimestamp
6Assets
activeStatus
laptop_real.jpg Multi-Method Probe cover image
Assets
Interactive Asset

PhysX-Anything

官方四段链直接处理 `laptop_real.jpg`。结果将其识别为 `Laptop`,拆成 `screen / screen_frame / base_side / shaft` 四个 part,并导出 `sample.glb + basic.urdf + basic.xml`。

4predicted parts
1predicted joints
ElectronicDevicecategory
PhysX-Anything Input real image
Input real image
PhysX-Anything official sample.glb
这是 PhysX-Anything 官方 decoder + split + sim-ready 的完整输出。该例最终包含一个 `C` 型 revolute 组,对应 laptop lid 的开合。
Interactive Asset

PartPacker

直接将同一张 `laptop_real.jpg` 送入 PartPacker 官方 flow 推理。输出了完整 `laptop_real_0.glb`,并分出 `3` 个 visible parts 与 `2` 个 dual-volume 视图。

3predicted parts
50 / 384steps / grid
officialflow config
PartPacker Input image
Input image
PartPacker full object
默认展示 PartPacker 的完整物体 GLB。下方保留三个 part GLB 和两个 volume GLB,用来直接看它对 laptop 的分解粒度。
Interactive Asset

OmniPart

用 laptop 图的桥接 `RGBA + mask.exr` 作为条件,走 OmniPart 官方 bbox + part synthesis 链。结果导出了 textured 和 segmented 两个 GLB,并给出了 3D bbox。

3predicted bboxes
25inference steps
mask-conditionedinput mode
OmniPart Input real image
Input real image
OmniPart Input image + mask visualization
Input image + mask visualization
OmniPart textured mesh
默认展示 OmniPart 的 textured mesh。该例需要额外 mask 条件,所以它代表的是 bridge 版 OmniPart 运行,而不是纯 RGB 零输入。
Interactive Asset

PAct

先用 `SAM2` 得到 laptop 的 `base / screen` 合并 mask,再送入 PAct 官方推理。预处理是成功的,但正式链路在 articulation decode 阶段出现 `NaN`,所以这一项诚实展示为失败。

mask okpreprocess
arti NaNfailure stage
0final glb
PAct Input real image
Input real image
PAct SAM2 overlay
SAM2 overlay
PAct Merged base / screen mask
Merged base / screen mask
PAct failure placeholder
PAct 这次的失败点不在 mask,而在 articulation decode:官方推理进入 `parse_tree()` 时出现 `NaN` joint type,未能导出最终 object GLB。
Interactive Asset

SINGAPO

SINGAPO 是 graph-conditioned articulated generation,所以这次对 `laptop_real.jpg` 使用了一个贴近笔记本的手工 graph prior:`base + door-like lid`。模型成功输出了一个很像笔记本的结构树与 3D bbox。

2predicted nodes
fixed / revolutejoint types
graph-conditionedinput mode
SINGAPO Input real image
Input real image
SINGAPO Graph prior visualization
Graph prior visualization
SINGAPO Generated kinematic tree
Generated kinematic tree
SINGAPO 3D bbox rendering
3D bbox rendering
SINGAPO 3D bbox structure
这里展示的是 SINGAPO 生成后的结构 bbox。对 laptop 这类铰链开合物体,它的 `base + door` 词表反而比较合适,所以结构结果比 chair 更自然。
Interactive Asset

TRELLIS2

TRELLIS2 这次直接走官方 image-to-3D 链。到 page 构建时,它已经完成 sparse / shape / texture 三段采样,但最终 `sample.glb` 仍未落盘,所以这里先诚实标成导出未完成。

sparse okstage 1
shape+tex okstage 2/3
export pendingfinal glb
TRELLIS2 Input real image
Input real image
TRELLIS2 export unresolved
这一项不是没跑,而是已经跑过三段 latent sampling,只是最终 mesh export/postprocess 还没有形成可交付 GLB。