Cross-Method Comparison · experiment detail
2026-04-22 15:30:00 UTC

chair_real.jpg Multi-Method Probe

把同一张真实椅子图分别送进 `PhysX-Anything / PartPacker / OmniPart / PAct / SINGAPO / TRELLIS2`。这页把各方法的真实输出并排放在一起,同时明确写出每条链是否需要额外 mask、graph prior,或在哪个阶段失败。

comparisonreal-imagechairPhysX-AnythingPartPackerOmniPartPActSINGAPOTRELLIS2
2026-04-22 15:30:00 UTCTimestamp
6Assets
activeStatus
chair_real.jpg Multi-Method Probe cover image
Assets
Interactive Asset

PhysX-Anything

官方四段链直接处理 `chair_real.jpg`。结果将其识别为 `Swivel Chair`,拆成 `Backrest / Seat / Pedestal` 三个静态 part,并导出 `sample.glb + basic.urdf + basic.xml`。

3predicted parts
0predicted joints
Furniturecategory
PhysX-Anything Input real image
Input real image
PhysX-Anything official sample.glb
这是 PhysX-Anything 官方 decoder 的 mesh-only 输出。该例最终 `group_info` 只有固定组,没有显式 articulated joint。
Interactive Asset

PartPacker

直接将同一张 `chair_real.jpg` 送入 PartPacker 官方 flow 推理。输出了完整 `chair_real_0.glb`,并分出 `2` 个 visible parts 与 `2` 个 dual-volume 视图。

2predicted parts
50 / 384steps / grid
officialflow config
PartPacker Input image
Input image
PartPacker full object
默认展示 PartPacker 的完整物体 GLB。下方下载区同时保留两个 part GLB 和两个 volume GLB,方便直接看它的部件分解粒度。
Interactive Asset

OmniPart

用 `chair_real.jpg` 的桥接 mask 作为条件,走 OmniPart 的 bbox + part synthesis 链。结果导出了 textured 和 segmented 两个 GLB,并给出了 `9` 个 part bbox。

9predicted bboxes
25inference steps
mask-conditionedinput mode
OmniPart Input real image
Input real image
OmniPart Input image + mask visualization
Input image + mask visualization
OmniPart textured mesh
默认展示 OmniPart 的 textured mesh。它依赖额外 mask 条件,所以这更像基于 chair_real 的桥接运行,而不是纯单 RGB 无条件推理。
Interactive Asset

PAct

先用 Appendix-D 风格 `VLM + SAM2` 预处理拿到 `processed.png + mask.exr`,再送入 PAct 官方推理。正式生成成功,最终导出 `11` 个节点、含 `fixed / revolute / prismatic` 的 articulated object。

11predicted nodes
fixed / rev / prisjoint families
official + Appendix-Dpipeline
PAct Input real image
Input real image
PAct Appendix-D SAM2 overlay
Appendix-D SAM2 overlay
PAct Merged part mask
Merged part mask
PAct PAct conditioning grid
PAct conditioning grid
PAct Predicted 3D bounding boxes
Predicted 3D bounding boxes
PAct Predicted kinematic tree
Predicted kinematic tree
Joint motion animation rendered from object.json
PAct assembled object
默认展示从 `object.json + part_i.glb` 装配出的完整物体。左侧保留了 chair_real 的 mask 预处理和条件网格,可直接核对 PAct 的输入条件。
Interactive Asset

SINGAPO

SINGAPO 本身是 graph-conditioned articulated generation,所以这次对 `chair_real.jpg` 采用了一个贴近椅子的手工 graph prior,再让模型生成结构输出。结果成功导出了树和 3D bbox,但语义明显受限于它的 appliance-style 词表。

4predicted nodes
fixed / prismaticjoint types
graph-conditionedinput mode
SINGAPO Input real image
Input real image
SINGAPO Graph prior visualization
Graph prior visualization
SINGAPO Generated kinematic tree
Generated kinematic tree
SINGAPO 3D bbox rendering
3D bbox rendering
SINGAPO 3D bbox structure
这里展示的是 SINGAPO 生成后的结构 bbox,而不是检索后 mesh。这个结果说明它能接住 chair 的 graph-conditioned 输入,但对椅子语义明显出域。
Interactive Asset

TRELLIS2

这次 chair_real 的 TRELLIS2 尝试采用本地 snapshot 和 shape-only 手工装配链。稀疏结构采样能走完,但 shape-slat 阶段因为 sparse coords 变空而失败,所以没有最终 chair GLB。

sparse OKstage 1
shape failstage 2
0final glb
TRELLIS2 Input real image
Input real image
TRELLIS2 Processed image used for shape-only run
Processed image used for shape-only run
TRELLIS2 failure placeholder
这一项是诚实展示失败:TRELLIS2 在该图上到达 sparse-structure 之后,shape stage 因 empty sparse coords 中断,没有最终 mesh。