输入逐部件归一化包围盒,输出每个可动关节的 类型轴方向轴心(垂足规范化)range。微调把轴方向从随机(中位 90°)拉到中位 0°,轴心垂距收紧约 8×;扩到全 46 类后轴更准(垂距 0.015)。
零样本时 part 名帮巨大(含名 0.76 vs 去名 0.42,模型靠 "door→revolute" 作弊);但微调后去名(0.85) ≈ 含名(0.86) —— 模型学到的是真"几何→运动学"映射,不是名字捷径。该结论在 4 组实验一致复现。
用 GAPartNet 标注,给部件 OBB 推 9 类 actionable 类别(把手/抽屉/门/旋钮/盖/按钮)。零样本≈0(fine-grained 新本体)→ 微调宏 F1 0.90;门/抽屉/把手/盖类 F1 0.85–1.0,仅 slider_button 0.59(按钮间几何近同、需纹理)。
留出 Box / Bucket / Camera / Dishwasher 4 类完全不训,评未见类。类型 0.57→0.80、轴角中位 90°→0°、垂距 0.32→0.10。类别越多迁移越强(8 类时 Refrigerator 几乎不动,46 类时未见类轴角已中位 0°)→ 几何→运动学是可迁移通则,非按类记惯例。
让每个部件单次同时输出运动学+affordance。旧版因输出过长被截断(parse 失败 30/208)拖低指标;精简 schema 后 parse 失败 30→9(−70%),各指标回升。运动信息(type/axis/range)完整体现;分任务上限仍更高。
| 非几何信息 | 现象 | 结论 |
|---|---|---|
| 关节 limit / range | 类别先验误差中位 42° > 全局常数 22.5°;LLM range 中位 0.06° 但均值 57.9° | limit 是记忆型,非几何推理型 |
| revolute ↔ continuous | 46 类 type acc 0.85→0.32 | "有无 limit" 是物理属性,静态几何判不出 |
| slider_button 区分 | F1 仅 0.59 | 按钮间几何近同,需纹理 |
→ 轴(方向+轴心)是几何可解瓶颈,已被 LLM 解决;limit 与部分类型属另一性质(物理/记忆)。精确印证并量化了 EPPUR 的 A7。
| 实验 | 数据 | 规模 | 核心结果 |
|---|---|---|---|
| A 关节 | PNM 8类 | 453/113 | 轴向→0°,垂距~8×,类型 0.85 |
| B 关节 | PNM 全46类 | 1708/422 | 轴跨46类泛化(垂距 0.015) |
| C affordance | GAPartNet | 835/208 | 宏 F1 0.90 |
| D 统一 | 运动+物理 | 835/208 | 精简后 parse 失败 30→9 |
| LOCO-46 | 留4类 | 1988/142 | 未见类 类型 0.57→0.80 |
设置:Qwen3.5-9B(modelscope)· LoRA r32 · transformers 5.12 隔离 venv · 8 卡 DDP · 轴心垂足规范化 · L0/L1 名泄漏消融。全部可复现:EPPUR/experiments/20260614_llm_joint/(6 套数据 prep + 3 评测器 + 12 adapter + 25 eval JSON + STAGE_REPORT)。