坟场灵感"回顾验证"
EPPUR · 2026-06-27 · 把搁置(坟场)里的想法逐个用一个干净对比(灵感 vs 基线)验证有效与否。目的=论文 ablation / lessons 素材,不是证明它新。预登记判据 + 重跑核对 + 正负如实。
结论:15 个灵感全跑完 → 14 个在预登记判据下验出有效,#11(省力/MDL 防假关节)如实记不显著。 两套证据:① 三维物体对比渲染(看见怎么解决/证伪,本页重点);② 每个灵感的定量对比 + 复现核对。
一、三维物体可视化:看见怎么解决 / 怎么证伪
★ 核心:关节轴为什么要紧(#2 RANSAC / #4 Kabsch-3D / #6 几何≠功能 / #7 fcl / #9 修复 / #10 MoE 共同的三维毛病)
真实微波炉门+机身。蓝=关门 / 绿=GT 轴:门干净摆开离开机身 / 红=错轴:门扫进机身、明显相交。轴错 → 门穿进机身 → 功能失效。上面这一簇灵感都在围着解决这同一个三维问题。
(诚实注:本物体单件 fcl 标量被 rest 重叠污染不可靠,故直接给几何;50 件聚合 fcl 确有区分度 func 0.63→0.42,见下方 #7。)
证伪(在 3D 里看见失败)
切门线:单图生成几何切不出门。 A=TRELLIS2 生成=门焊进一个壳(只能切一层皮)/ B=真实 GT+同管线=只切到约一半 / C=真实 GT=门本就是独立件(完美,但推理时拿不到)。→ 上游融合壳 + 切门法两头都有问题。
#12 公开分割器把动件切碎。 P3-SAM 在闭态微波炉上分件上色:件数中位 2.8× 于真实,门/铰链区被切碎 → 不能直接拿 P3-SAM 当关节件提案。
#3 想象多态的相机会漂。 gpt-image 想象开态 vs 真渲:开门方向对(11/12),但相机普遍 zoom/shift(一致仅 3/12)→ 想象只供方向/语义,不能三角化解轴。
#13/#8 两态互监督找回门。 两态(门新位置)门 IoU 0.92 ≫ 单态 P3-SAM 0.19;单张静态 mesh 没有运动线索。
解决(在 3D 里看见修复)
#1 POE 结构生成的运动(轴跨配置不漂);对照逐配置回归头轴漂 55°。
#5/#9 物理后处理/一致损失保 range:修后预测 range 物理可行、零穿模(#47 func 0.155→1.0)。
#14 VLM 补漏标动件:马桶 → VLM 答 seat + lid(+flush button);门/抽屉固定 taxonomy=0。
#15 小/对称件:cart → VLM 答 wheels(motion-invisible);单态运动法看不见。
二、总表(#1–#15:灵感 / 基线 / 灵感值 / 是否有效 / 复现)
| # | 灵感 | 基线 | 灵感值(原始数) | 有效? | 复现旧数 |
| 1 | POE 结构保证一致 | 逐配置回归头 | 轴 2.9°/跨配置漂 0° | ✅ | ✅(2.88/55.8) |
| 2 | 先轴后部件 RANSAC | 先分割再拟轴 | 干净 0°/模拟漂 6.3° | ✅ | ✅ |
| 3 | 想象态方向可靠相机漂 | 真渲多态 | 开向 11/12、相机 3/12 | ✅ | ✅ |
| 4 | 3D 解轴稳/抗噪 | 2D 轮廓 | Kabsch≈0°、10%噪声<1.1° vs 2D 65.7° | ✅ | ✅ |
| 5 | 物理一致损失→range安全 | 不加该损失 | 零穿模 8/20→15/20 | ✅ | ✅ |
| 6 | 几何≠功能 | corr(轴误差,func) | corr(穿模,func)=−0.85 vs −0.15 | ✅ | ✅(重跑−0.152/−0.852) |
| 7 | 凸包漏腔/必须 fcl | pybullet 凸包 | fcl 0.63→0.42 区分 + GT 28% 自穿 | ✅(部分) | 🟡 凸包基线仅报告 |
| 8 | 两态>单图(消歧) | 单图 | 双态置信 0.96 vs 0.73 + IoU 见#13 | ✅ | ✅ |
| 9 | agent 物理反馈修复 | 无迭代 | 救回 40%(中位仍0) | ✅(部分) | ✅ |
| 10 | MoE 类型路由 | dense 头 | 6.2°→4.6° | ✅ | ✅ |
| 11 | 省力/MDL 防假关节 | 不罚自由度 | 本例无法干净隔离关节 | ❌ 不显著 | 新跑·负结果 |
| 12 | 铰链区过分割 | 真实件数 | P3-SAM 中位 2.8×/均值 3.0× | ✅ | ✅ |
| 13 | 两态互监督分割 | 单态 P3-SAM | 门 IoU 0.92 vs 0.19 | ✅ | 新跑 |
| 14 | VLM 补漏标动件 | 门/抽屉 taxonomy(0) | 马桶召回 seat+lid | ✅ | 新跑(真VLM) |
| 15 | 小/对称件 SoM | 单态运动法(0) | cart 检出 wheels | ✅ | 新跑(真VLM) |
三、定量对比图(每个灵感一张)
#1 POE vs 回归头
#6 几何 vs 功能(穿模才是功能近因)
#7 fcl 区分度 + GT 自穿
#10 MoE vs dense
#12 P3-SAM 过分割(逐物体)
#13 两态 vs 单态门 IoU
其余定量图(#2/#5/#9/#11/#14/#15 等)见目录 validation_20260627/figs_all/。
四、诚实清单(必须看)
旧数口径要纠正(以真实重算为准):
• #6:指令表写"−0.31 vs −0.85",真实数据是 −0.152 vs −0.852(重跑 run_t6 精确复现)。轴相关更弱,反而更强化"几何≠功能"。
• #7:凸包基线"func~0.98 平/无区分度"只来自报告文字、数据未单存;我只复现 fcl 这一侧。GT 自穿我算 28%(阈值 pen>0.05)vs 报告 22%(阈值口径不同)。
验出不显著(如实,不硬凑): #11 省力/MDL 防假关节 在单微波炉上未能干净隔离关节(P3-SAM 无门区 + 低模门面不连通)→ 记不显著,需多关节基准重验。
本轮自查抓到并修掉的 bug(3D 渲染/度量):凸包判穿模结论反了→改 fcl;fcl 布尔永远碰撞(共享铰链接缝)→改各 link 独立 obj;fcl 标量被 rest 重叠污染(0.435/0.435)→去假数改几何直观;门被材质覆盖渲成灰→剥材质让绿/红显示。
【免】不验的 6 类:对称定轴/几何修复保行程(依赖几何太脆)、闭链(太难且搁置)、动力学参数(非本项目)、场景约束(已被#3覆盖)、纯prompt几何一致/视频先验(要跑重模型)。
报告 reports/EPPUR_GRAVEYARD_VALIDATION_20260627.md · 代码/图 EPPUR/experiments/validation_20260627/{figs3d,figs_all}/ · 相关 切门 + GT 隔离实验