Cross-Method Comparison · experiment detail

2026-04-22 23:45:00 UTC

laptop_real.jpg Multi-Method Probe

把同一张真实笔记本图分别送进 `PhysX-Anything / PartPacker / OmniPart / PAct / SINGAPO / TRELLIS2`。这页把各方法的真实输出并排展示，同时明确写出 bridge 条件、graph prior，或具体失败阶段。

comparisonreal-imagelaptopPhysX-AnythingPartPackerOmniPartPActSINGAPOTRELLIS2

2026-04-22 23:45:00 UTCTimestamp

6Assets

activeStatus

laptop_real.jpg Multi-Method Probe cover image

Assets

Interactive Asset

PhysX-Anything

官方四段链直接处理 `laptop_real.jpg`。结果将其识别为 `Laptop`，拆成 `screen / screen_frame / base_side / shaft` 四个 part，并导出 `sample.glb + basic.urdf + basic.xml`。

下载 sample.glb 下载 basic_info.json 下载 articulated_blueprint.json 下载 basic.urdf

4predicted parts

1predicted joints

ElectronicDevicecategory

PhysX-Anything Input real image — Input real image

PhysX-Anything official sample.glb

这是 PhysX-Anything 官方 decoder + split + sim-ready 的完整输出。该例最终包含一个 `C` 型 revolute 组，对应 laptop lid 的开合。

Interactive Asset

PartPacker

直接将同一张 `laptop_real.jpg` 送入 PartPacker 官方 flow 推理。输出了完整 `laptop_real_0.glb`，并分出 `3` 个 visible parts 与 `2` 个 dual-volume 视图。

下载 full GLB 下载 part0.glb 下载 part1.glb 下载 part2.glb 下载 vol0.glb 下载 vol1.glb

3predicted parts

50 / 384steps / grid

officialflow config

PartPacker full object

默认展示 PartPacker 的完整物体 GLB。下方保留三个 part GLB 和两个 volume GLB，用来直接看它对 laptop 的分解粒度。

Interactive Asset

OmniPart

用 laptop 图的桥接 `RGBA + mask.exr` 作为条件，走 OmniPart 官方 bbox + part synthesis 链。结果导出了 textured 和 segmented 两个 GLB，并给出了 3D bbox。

下载 textured GLB 下载 segmented GLB 下载 bbox numpy

3predicted bboxes

25inference steps

mask-conditionedinput mode

OmniPart Input real image — Input real image

OmniPart Input image + mask visualization — Input image + mask visualization

OmniPart textured mesh

默认展示 OmniPart 的 textured mesh。该例需要额外 mask 条件，所以它代表的是 bridge 版 OmniPart 运行，而不是纯 RGB 零输入。

Interactive Asset

PAct

先用 `SAM2` 得到 laptop 的 `base / screen` 合并 mask，再送入 PAct 官方推理。预处理是成功的，但正式链路在 articulation decode 阶段出现 `NaN`，所以这一项诚实展示为失败。

下载 failure.txt 下载 stage0_granularity.json 下载 stage1_classification.json 下载 stage2_merge.json 下载 summary.json

mask okpreprocess

arti NaNfailure stage

0final glb

PAct Input real image — Input real image

PAct Merged base / screen mask — Merged base / screen mask

PAct failure placeholder

PAct 这次的失败点不在 mask，而在 articulation decode：官方推理进入 `parse_tree()` 时出现 `NaN` joint type，未能导出最终 object GLB。

Interactive Asset

SINGAPO

SINGAPO 是 graph-conditioned articulated generation，所以这次对 `laptop_real.jpg` 使用了一个贴近笔记本的手工 graph prior：`base + door-like lid`。模型成功输出了一个很像笔记本的结构树与 3D bbox。

下载 pred_graph.json 下载 object.json 下载 bbox_3d.glb

2predicted nodes

fixed / revolutejoint types

graph-conditionedinput mode

SINGAPO Input real image — Input real image

SINGAPO Graph prior visualization — Graph prior visualization

SINGAPO Generated kinematic tree — Generated kinematic tree

SINGAPO 3D bbox rendering — 3D bbox rendering

SINGAPO 3D bbox structure

这里展示的是 SINGAPO 生成后的结构 bbox。对 laptop 这类铰链开合物体，它的 `base + door` 词表反而比较合适，所以结构结果比 chair 更自然。

Interactive Asset

TRELLIS2

TRELLIS2 这次直接走官方 image-to-3D 链。到 page 构建时，它已经完成 sparse / shape / texture 三段采样，但最终 `sample.glb` 仍未落盘，所以这里先诚实标成导出未完成。

下载 status.txt

sparse okstage 1

shape+tex okstage 2/3

export pendingfinal glb

TRELLIS2 Input real image — Input real image

TRELLIS2 export unresolved

这一项不是没跑，而是已经跑过三段 latent sampling，只是最终 mesh export/postprocess 还没有形成可交付 GLB。