PAct Eval100 easy-case probe: cabinets, doors, drawers

Manual easy-case probe over simple cabinets, doors, drawers, and one PM fixture-like sample with VLM QA and interactive 3D previews.

Dataset audit: True · samples: 8 · mean weighted score: 40.86 · mean joint F1: 0.00

manual benchmark_index selection: 25, 29, 42, 74, 80, 91, 95, 60

report.json · report.md

#25 GRScenes / large_furniture

evaluation card
39.0 score 0 part MAE 0.00 joint F1 0.47 scale

parts GT/PAct 2/2 · joints GT/PAct 0/1 · axis err 90.0 deg

Source textured
GT parts
PAct output
以下是对PAct在该样本上表现的简短测评和问题发现:

1.  **几何完整性与Part分解:** PAct成功地将物体分解为2个part,与GT parts数量一致(part_count_mae=0)。从2D mask看,分解是基于水平分割的,这与输入图像中物体下方的两条细线(可能代表抽屉或门缝)相符。
2.  **关节数量/类型与运动可行性:** GT movable为0,表明该物体在真实情况下是不可动的。然而,PAct的joint_f1为0.000,这可能意味着PAct未能识别出任何关节,或者错误地识别了关节。考虑到GT是不可动的,未能识别出关节是符合预期的。
3.  **对2D分割的依赖:** PAct的part分解与2D part mask高度一致,表明模型强烈依赖2D分割信息来定义部件。这种依赖性在处理不可动物体时可能不是问题,但对于复杂的可动物体,如果2D分割无法准确反映3D部件和关节,可能会导致生成的三维铰链物体不准确。
4.  **PActscore较低:** PAct weighted_score为38.98,相对较低,这可能反映了在其他未直接展示的指标(如几何精度、关节位置/轴线精度等)上存在不足,即使part数量匹配。

#29 GAPartNet / storage

evaluation card
42.4 score 0 part MAE 0.00 joint F1 0.68 scale

parts GT/PAct 2/2 · joints GT/PAct 1/1 · axis err 90.0 deg

Source textured
GT parts
PAct output
以下是对PAct在该样本上表现的简短测评和问题发现:

1.  **几何完整性与Part分解良好:** PAct成功地从2D part mask中重建出具有两个部件的3D物体,几何形状与输入图像高度一致,且部件分解与GT parts数量(2个)匹配。
2.  **关节识别与运动可行性存在问题:** `joint_f1=0.000` 表明模型未能识别出任何关节,因此无法推断出盖子的可移动性,尽管GT movable为1。这导致运动可行性评估失败。
3.  **对2D分割的依赖性可能导致运动信息缺失:** 尽管2D mask清晰地分离了盖子和主体,但PAct未能从这种分离中推断出盖子是可移动的部件。这可能揭示了模型在从静态2D分割中理解3D关节和运动关系方面的局限性。
4.  **PAct score较低,主要受关节识别影响:** 42.35的加权分数相对较低,很可能主要归因于未能识别出关节,因为part count MAE为0,表明部件分解是准确的。

#42 GRScenes / small_furniture

evaluation card
33.8 score 1 part MAE 0.00 joint F1 0.58 scale

parts GT/PAct 3/2 · joints GT/PAct 2/1 · axis err 90.0 deg

Source textured
GT parts
PAct output
以下是对PAct在该样本上的简短测评和问题发现:

1.  **Part 分解不准确且依赖2D分割:** PAct将抽屉把手所在的整个顶部表面分割为两个可动部件(蓝色和绿色),而忽略了把手本身,这与实际的抽屉结构不符。这强烈暴露出对2D分割的依赖,因为2D mask直接将顶部表面分为两块。
2.  **几何完整性与运动可行性差:** 实际的床头柜抽屉应是可拉出的,但PAct的分割方式(将顶部表面分为两块)无法实现合理的抽拉运动。GT parts=3,GT movable=2,但PAct的part_count_mae=1,joint_f1=0.000,表明其在关节识别和可动部件数量上存在严重偏差。
3.  **关节数量/类型识别失败:** joint_f1为0.000,说明PAct完全未能识别出正确的关节或其类型。模型将两个表面块视为可动部件,但没有为它们分配任何有意义的关节类型(如滑动关节)。
4.  **对复杂内部结构理解不足:** 尽管输入是单视图,但模型未能从视觉线索(如把手)推断出抽屉的内部结构和其作为可动部件的属性,而是简单地将可见的2D分割映射到3D。

#74 GRScenes / architectural_fixtures

evaluation card
40.0 score 0 part MAE 0.00 joint F1 0.53 scale

parts GT/PAct 2/2 · joints GT/PAct 1/1 · axis err 90.0 deg

Source textured
GT parts
PAct output
以下是对PAct在该样本上表现的简短测评和问题发现:

1.  **Part分解准确,但几何完整性受限:** PAct正确识别出2个部件(门框和门扇),与GT一致(part_count_mae=0)。然而,从2D mask看,门把手等细节未被分割出来,可能导致3D几何模型缺乏这些细节。
2.  **关节识别完全失败:** joint_f1为0.000表明PAct未能识别出任何关节,或识别出的关节与GT完全不匹配。这直接影响了运动可行性。
3.  **运动可行性存疑:** 由于关节识别失败,即使几何分解正确,也无法保证生成的三维模型具有正确的铰链运动能力。
4.  **对2D分割的依赖性暴露:** 2D part mask中门把手等关键铰链部件未被独立分割,这可能直接导致PAct无法推断出正确的关节位置和类型,暴露出模型对输入2D分割质量的强依赖。

#80 GRScenes / architectural_fixtures

evaluation card
41.1 score 0 part MAE 0.00 joint F1 0.60 scale

parts GT/PAct 2/2 · joints GT/PAct 1/1 · axis err 90.0 deg

Source textured
GT parts
PAct output
以下是对PAct在给定样本上的简短测评和问题发现:

1.  **几何完整性良好,part分解准确:** PAct成功地将门分解为两个部分(门扇和门框),与GT parts数量一致(part_count_mae=0),几何形状也保持完整。
2.  **关节识别和运动可行性存在严重问题:** joint_f1=0.000表明PAct未能识别出任何关节,因此无法推断出门的铰链运动,导致运动可行性为零。
3.  **对2D分割的依赖性暴露:** 尽管2D part mask清晰地将门扇和门框分开,但PAct未能利用此信息来推断它们之间的铰链关系,这可能表明其关节推理模块对2D分割的依赖性不足或存在缺陷。
4.  **PAct score较低:** 41.06的加权分数相对较低,主要原因在于未能识别关节,这严重影响了整体性能。

#91 ArtVIP / small_furniture

evaluation card
44.5 score 0 part MAE 0.00 joint F1 0.82 scale

parts GT/PAct 2/2 · joints GT/PAct 1/1 · axis err 90.0 deg

Source textured
GT parts
PAct output
以下是对PAct在该样本上的简短测评和问题发现:

1.  **几何完整性差,Part分解不合理:** 生成的三维模型几何形状扭曲,与原始图像差异大。Part分解虽然数量正确(GT parts=2,PAct part_count_mae=0),但蓝色部分包含了桌子主体和部分腿,红色部分是一个独立的方块,与实际的抽屉结构不符。
2.  **关节信息缺失,运动不可行:** joint_f1=0.000 表明模型未能识别出任何关节。这意味着即使part分解正确,也无法实现抽屉的滑动等运动,导致运动可行性为零。
3.  **对2D分割的依赖性暴露:** 生成的三维模型在几何上似乎直接从2D part mask的形状进行拉伸或挤压,导致了不自然的几何形状(例如蓝色部分下方的“滴落”状结构),这强烈暴露出对2D分割的直接依赖,而缺乏对三维结构和物理合理性的理解。
4.  **PAct score较低:** 44.48的加权分数表明整体性能不佳,这与几何扭曲、关节识别失败等问题一致。

#95 ArtVIP / small_furniture

evaluation card
43.4 score 0 part MAE 0.00 joint F1 0.75 scale

parts GT/PAct 2/2 · joints GT/PAct 1/1 · axis err 90.0 deg

Source textured
GT parts
PAct output
以下是对PAct在给定样本上的简短测评和问题发现:

1.  **几何完整性与Part分解良好:** PAct成功地将床头柜分解为两个部分(柜体和抽屉),与GT parts数量一致(part_count_mae=0),且几何形状保持完整。
2.  **关节识别失败:** PAct未能识别出抽屉的可移动关节(joint_f1=0.000),尽管GT显示有一个可移动部件。这表明模型在理解部件间的运动关系方面存在不足。
3.  **运动可行性缺失:** 由于未能识别关节,PAct无法为抽屉生成可行的运动,这直接影响了生成三维铰链物体的核心目标。
4.  **对2D分割的依赖可能导致关节缺失:** 2D part mask清晰地将抽屉和柜体分开,但并未直接编码关节信息。PAct可能过度依赖2D分割的静态边界,而未能从单视图输入中推断出潜在的运动机制。

#60 PartNetMobility / architectural_fixtures

evaluation card
42.9 score 0 part MAE 0.00 joint F1 0.72 scale

parts GT/PAct 2/2 · joints GT/PAct 1/1 · axis err 90.0 deg

Source textured
GT parts
PAct output
以下是对 PAct 在该样本上的简短测评和问题发现:

1.  **几何完整性与 Part 分解:** PAct 生成的 3D 几何形状与 2D part mask 吻合,但与原始输入图像相比,丢失了内部的多个小隔板细节,只保留了外部框架和一个可移动的盖子。这表明模型可能过度简化了复杂结构。
2.  **关节数量/类型与运动可行性:** 尽管 `part_count_mae=0` 表明 part 数量与 GT 相同,但 `joint_f1=0.000` 严重偏低,说明模型未能正确识别或生成任何关节。这导致了运动可行性为零,与 GT 中存在一个可移动部件(`GT movable=1`)不符。
3.  **对 2D 分割的依赖:** PAct 的输出(2D part mask)直接反映了对输入图像的简化理解,即只识别出两个主要部分。这强烈暴露出模型对 2D 分割结果的依赖,当 2D 分割未能捕捉到所有细微结构时,3D 生成也会相应地缺失这些细节和潜在的关节。
4.  **整体性能:** PAct 的 `weighted_score=42.88` 较低,主要受 `joint_f1` 为零的拖累。模型在识别部件数量上表现良好,但在理解部件之间的铰链关系和生成可动关节方面存在严重缺陷。