严格按 SceneTransporter 的核心思想做了一个最小 probe:不直接碰 3D 生成器,而是只比较 patch-to-part assignment。本次在 6 个 PartNeXt rendered inputs 上对比了 `SAM`、`DINO patch KMeans`、`cosine routing`、`OT-noedge` 和 `SceneTransporter 风格 OT+edge`。结果并不自动站在 OT 这一边:均值上 `KMeans/cosine = 0.760`,`OT+edge = 0.708`,`OT-noedge = 0.702`,`SAM = 0.619`。这说明论文里的 assignment 约束思想很强,但在我们当前“无 compositional latent、只有图像 patch 特征”的简化设定里,还不能直接复制出它的优势。
GT 顶层 part 数为 2,名称是 `Blade / Handle`。最好的结构分离方法是 `kmeans`,matched IoU = 1.000。为了避免原始 patch mask 看起来像大方块,页面里额外放了 `boundary overlay` 和 `watershed-refined overlay`。完整对比分数:kmeans=1.000 / cosine=1.000 / ot_noedge=1.000 / ot_edge=0.945 / sam=0.498。
GT 顶层 part 数为 3,名称是 `Tank / Toilet Lid / Toilet Base`。最好的结构分离方法是 `sam`,matched IoU = 0.344。为了避免原始 patch mask 看起来像大方块,页面里额外放了 `boundary overlay` 和 `watershed-refined overlay`。完整对比分数:sam=0.344 / kmeans=0.325 / cosine=0.325 / ot_noedge=0.325 / ot_edge=0.299。
GT 顶层 part 数为 2,名称是 `Display / Stand`。最好的结构分离方法是 `sam`,matched IoU = 1.000。为了避免原始 patch mask 看起来像大方块,页面里额外放了 `boundary overlay` 和 `watershed-refined overlay`。完整对比分数:sam=1.000 / ot_edge=0.954 / kmeans=0.889 / cosine=0.889 / ot_noedge=0.889。
GT 顶层 part 数为 2,名称是 `String Components / Guitar Main Components`。最好的结构分离方法是 `sam`,matched IoU = 1.000。为了避免原始 patch mask 看起来像大方块,页面里额外放了 `boundary overlay` 和 `watershed-refined overlay`。完整对比分数:sam=1.000 / kmeans=0.643 / cosine=0.643 / ot_noedge=0.643 / ot_edge=0.643。
GT 顶层 part 数为 4,名称是 `Body / Spout / Lid / Handle`。最好的结构分离方法是 `kmeans`,matched IoU = 0.795。为了避免原始 patch mask 看起来像大方块,页面里额外放了 `boundary overlay` 和 `watershed-refined overlay`。完整对比分数:kmeans=0.795 / cosine=0.795 / ot_edge=0.586 / ot_noedge=0.538 / sam=0.369。
GT 顶层 part 数为 3,名称是 `Screen Side / Bottom Side / Hinge`。最好的结构分离方法是 `kmeans`,matched IoU = 0.909。为了避免原始 patch mask 看起来像大方块,页面里额外放了 `boundary overlay` 和 `watershed-refined overlay`。完整对比分数:kmeans=0.909 / cosine=0.909 / ot_noedge=0.818 / ot_edge=0.818 / sam=0.500。