PAct · experiment detail
2026-04-19 23:58:00 UTC

PAct x PartNeXt Multi-Category Eval

把 PartNeXt probe 扩成了 9 个有效类别:`Knife / Toilet / Monitor / Guitar / Teapot / Laptop / Chair / Microwave / Mug`。另外还有 `Handbag / Lamp / Sofa` 3 类因为当前自动视角渲染成了空 alpha,被明确排除,不和模型质量混在一起。有效 9 类上的结果很稳定:`mean_gt_coarse_part_count = 2.67`,`mean_pred_num_nodes = 2.56`,`mean_part_count_abs_error = 0.11`。也就是说 PAct 在 PartNeXt 上大体能保住 coarse slot 数,但语义几乎系统性地往 `door/base/drawer` 一类 appliance 模板漂移。

PActPartNeXtmulti-categorycross-datasetsemantic-drift
2026-04-19 23:58:00 UTCTimestamp
9Assets
activeStatus
PAct x PartNeXt Multi-Category Eval cover image
Assets
Interactive Asset

Knife_00602ef508784e5384665aacaaf1f3a0

GT coarse parts 是 `Blade + Handle`,PAct 保住了 2 个槽位,但输出成 `base + door`,并给了一个 `revolute`。这说明它能保住结构数,却仍会把陌生类别向熟悉的可动门模板回拉。

2 -> 2GT / pred parts
base / doorpred names
F + Rpred joints
Knife_00602ef508784e5384665aacaaf1f3a0 Rendered input image
Rendered input image
Knife_00602ef508784e5384665aacaaf1f3a0 PartNeXt coarse mask overlay
PartNeXt coarse mask overlay
Knife predicted assembled object
默认 viewer 是 PAct 预测整物体,右下下载区可以拿到 coarse reference GLB 直接对照。
Interactive Asset

Toilet_01b31c7fb7bd41ac8019ffc994b22b60

GT coarse parts 是 `Tank + Toilet Lid + Toilet Base`,PAct 输出成 `base + base + door`。和 `Chair` 很像:节点数没丢,但真正可动的 lid 被模型重新解释成了 `door`。

3 -> 3GT / pred parts
base / base / doorpred names
F + F + Rpred joints
Toilet_01b31c7fb7bd41ac8019ffc994b22b60 Rendered input image
Rendered input image
Toilet_01b31c7fb7bd41ac8019ffc994b22b60 PartNeXt coarse mask overlay
PartNeXt coarse mask overlay
Toilet predicted assembled object
这个例子说明 even when the topology is right, the motion semantics still get pulled toward door/base language.
Interactive Asset

Monitor_01ce620e70ff40708eb4a1b04f4a828e

GT coarse parts 是 `Display + Stand`,PAct 依旧输出 `door + base`。这说明它对非 appliance 类的两部件物体,也会优先套用熟悉的 `door/base` 模板。

2 -> 2GT / pred parts
door / basepred names
R + Fpred joints
Monitor_01ce620e70ff40708eb4a1b04f4a828e Rendered input image
Rendered input image
Monitor_01ce620e70ff40708eb4a1b04f4a828e PartNeXt coarse mask overlay
PartNeXt coarse mask overlay
Monitor predicted assembled object
这是最标准的“结构对,语义错”的中间态之一。
Interactive Asset

Guitar_553a53ba86804d4da6e51946a6011b0e

GT 是 `String Components + Guitar Main Components`,但 PAct 还是输出 `base + door`。这说明对乐器这类长尾几何,模型基本只剩下 coarse bipartition 能力,语义完全被训练域先验覆盖。

2 -> 2GT / pred parts
base / doorpred names
F + Rpred joints
Guitar_553a53ba86804d4da6e51946a6011b0e Rendered input image
Rendered input image
Guitar_553a53ba86804d4da6e51946a6011b0e PartNeXt coarse mask overlay
PartNeXt coarse mask overlay
Guitar predicted assembled object
Guitar 是个好对照,因为它没有任何合理的 'door' 语义,但模型仍然会这样命名。
Interactive Asset

Teapot_7641732252ad47a5af0828d4f471338b

这是这组里最有信息量的长尾例子。GT coarse parts 是 `Body + Spout + Lid + Handle`,PAct 居然保住了 4 个节点,但输出语义漂成 `base + door + base + wheel`。说明 part slots 数量可以被保住,但 slot semantics 已经完全不可信了。

4 -> 4GT / pred parts
base / door / base / wheelpred names
F + R + F + Cpred joints
Teapot_7641732252ad47a5af0828d4f471338b Rendered input image
Rendered input image
Teapot_7641732252ad47a5af0828d4f471338b PartNeXt coarse mask overlay
PartNeXt coarse mask overlay
Teapot predicted assembled object
Teapot 非常适合看 'slot count right, semantics wrong' 这个现象。
Interactive Asset

Laptop_Computer_a14d471ffda04d38a1910b9ef87e8dff

这是这轮唯一明显丢槽位的例子。GT coarse parts 是 `Screen Side + Bottom Side + Hinge`,PAct 只输出了 2 个节点:`base + knob`,而且还给出一个很奇怪的 `screw` 关节类型。它说明一旦输入视图里某些小 part 可见性太低,PAct 的 coarse slot 也会开始塌缩。

3 -> 2GT / pred parts
base / knobpred names
F + screwpred joints
Laptop_Computer_a14d471ffda04d38a1910b9ef87e8dff Rendered input image
Rendered input image
Laptop_Computer_a14d471ffda04d38a1910b9ef87e8dff PartNeXt coarse mask overlay
PartNeXt coarse mask overlay
Laptop predicted assembled object
这个例子提醒我们:现在这条桥不仅有语义漂移,还有视角可见性问题。
Interactive Asset

Chair_019131b6267246bfa44afe60eca5cceb

GT coarse parts 是 `Backrest + Seat + Base`,PAct 输出成 `base + base + door`。这是前一轮小实验里最典型的模式,这次在更大类别集里依然复现了。

3 -> 3GT / pred parts
base / base / doorpred names
F + F + Rpred joints
Chair_019131b6267246bfa44afe60eca5cceb Rendered input image
Rendered input image
Chair_019131b6267246bfa44afe60eca5cceb PartNeXt coarse mask overlay
PartNeXt coarse mask overlay
Chair predicted assembled object
Chair 仍然是观察 `door/base` 语义漂移的标准样本。
Interactive Asset

Microwave_Oven_b310935556f645508f49323791feed34

这仍然是最像样的跨类结果之一。GT coarse parts 是 `Control Panel + Casing + Door`,PAct 输出 `door + base + drawer`。它说明 appliance-like 对象最容易激活模型原有的结构模板。

3 -> 3GT / pred parts
door / base / drawerpred names
R + F + Ppred joints
Microwave_Oven_b310935556f645508f49323791feed34 Rendered input image
Rendered input image
Microwave_Oven_b310935556f645508f49323791feed34 PartNeXt coarse mask overlay
PartNeXt coarse mask overlay
Microwave predicted assembled object
Microwave 是这组里和 PAct 原始分布最近的对象,因此结果也最合理。
Interactive Asset

Mug_ec0fa3372f624afa879f0dafba9db19c

GT coarse parts 是 `Body + Handle`,但 PAct 还是输出了 `door + base`。这类小物体和 `Knife/Guitar` 一致,都是 coarse bipartition 还能保住,但语义几乎完全 appliance 化。

2 -> 2GT / pred parts
door / basepred names
R + Fpred joints
Mug_ec0fa3372f624afa879f0dafba9db19c Rendered input image
Rendered input image
Mug_ec0fa3372f624afa879f0dafba9db19c PartNeXt coarse mask overlay
PartNeXt coarse mask overlay
Mug predicted assembled object
Mug 是个很好的非 appliance 双部件对照。