坟场灵感"回顾验证"

EPPUR · 2026-06-27 · 把搁置(坟场)里的想法逐个用一个干净对比(灵感 vs 基线)验证有效与否。目的=论文 ablation / lessons 素材,不是证明它新。预登记判据 + 重跑核对 + 正负如实。

结论:15 个灵感全跑完 → 14 个在预登记判据下验出有效,#11(省力/MDL 防假关节)如实记不显著。 两套证据:① 三维物体对比渲染(看见怎么解决/证伪,本页重点);② 每个灵感的定量对比 + 复现核对。

一、三维物体可视化:看见怎么解决 / 怎么证伪

★ 核心:关节轴为什么要紧(#2 RANSAC / #4 Kabsch-3D / #6 几何≠功能 / #7 fcl / #9 修复 / #10 MoE 共同的三维毛病)

真实微波炉门+机身。蓝=关门 / 绿=GT 轴:门干净摆开离开机身 / 红=错轴:门扫进机身、明显相交。轴错 → 门穿进机身 → 功能失效。上面这一簇灵感都在围着解决这同一个三维问题。
(诚实注:本物体单件 fcl 标量被 rest 重叠污染不可靠,故直接给几何;50 件聚合 fcl 确有区分度 func 0.63→0.42,见下方 #7。)

证伪(在 3D 里看见失败)

切门线:单图生成几何切不出门。 A=TRELLIS2 生成=门焊进一个壳(只能切一层皮)/ B=真实 GT+同管线=只切到约一半 / C=真实 GT=门本就是独立件(完美,但推理时拿不到)。→ 上游融合壳 + 切门法两头都有问题。
#12 公开分割器把动件切碎。 P3-SAM 在闭态微波炉上分件上色:件数中位 2.8× 于真实,门/铰链区被切碎 → 不能直接拿 P3-SAM 当关节件提案。
#3 想象多态的相机会漂。 gpt-image 想象开态 vs 真渲:开门方向对(11/12),但相机普遍 zoom/shift(一致仅 3/12)→ 想象只供方向/语义,不能三角化解轴。
#13/#8 两态互监督找回门。 两态(门新位置)门 IoU 0.92 ≫ 单态 P3-SAM 0.19;单张静态 mesh 没有运动线索。

解决(在 3D 里看见修复)

#1 POE 结构生成的运动(轴跨配置不漂);对照逐配置回归头轴漂 55°。
#5/#9 物理后处理/一致损失保 range:修后预测 range 物理可行、零穿模(#47 func 0.155→1.0)。
#14 VLM 补漏标动件:马桶 → VLM 答 seat + lid(+flush button);门/抽屉固定 taxonomy=0。
#15 小/对称件:cart → VLM 答 wheels(motion-invisible);单态运动法看不见。

二、总表(#1–#15:灵感 / 基线 / 灵感值 / 是否有效 / 复现)

#灵感基线灵感值(原始数)有效?复现旧数
1POE 结构保证一致逐配置回归头轴 2.9°/跨配置漂 0°✅(2.88/55.8)
2先轴后部件 RANSAC先分割再拟轴干净 0°/模拟漂 6.3°
3想象态方向可靠相机漂真渲多态开向 11/12、相机 3/12
43D 解轴稳/抗噪2D 轮廓Kabsch≈0°、10%噪声<1.1° vs 2D 65.7°
5物理一致损失→range安全不加该损失零穿模 8/20→15/20
6几何≠功能corr(轴误差,func)corr(穿模,func)=−0.85 vs −0.15✅(重跑−0.152/−0.852)
7凸包漏腔/必须 fclpybullet 凸包fcl 0.63→0.42 区分 + GT 28% 自穿✅(部分)🟡 凸包基线仅报告
8两态>单图(消歧)单图双态置信 0.96 vs 0.73 + IoU 见#13
9agent 物理反馈修复无迭代救回 40%(中位仍0)✅(部分)
10MoE 类型路由dense 头6.2°→4.6°
11省力/MDL 防假关节不罚自由度本例无法干净隔离关节❌ 不显著新跑·负结果
12铰链区过分割真实件数P3-SAM 中位 2.8×/均值 3.0×
13两态互监督分割单态 P3-SAM门 IoU 0.92 vs 0.19新跑
14VLM 补漏标动件门/抽屉 taxonomy(0)马桶召回 seat+lid新跑(真VLM)
15小/对称件 SoM单态运动法(0)cart 检出 wheels新跑(真VLM)

三、定量对比图(每个灵感一张)

#1 POE vs 回归头
#6 几何 vs 功能(穿模才是功能近因)
#7 fcl 区分度 + GT 自穿
#10 MoE vs dense
#12 P3-SAM 过分割(逐物体)
#13 两态 vs 单态门 IoU

其余定量图(#2/#5/#9/#11/#14/#15 等)见目录 validation_20260627/figs_all/

四、诚实清单(必须看)

旧数口径要纠正(以真实重算为准):
#6:指令表写"−0.31 vs −0.85",真实数据是 −0.152 vs −0.852(重跑 run_t6 精确复现)。轴相关更弱,反而更强化"几何≠功能"。
#7:凸包基线"func~0.98 平/无区分度"只来自报告文字、数据未单存;我只复现 fcl 这一侧。GT 自穿我算 28%(阈值 pen>0.05)vs 报告 22%(阈值口径不同)。
验出不显著(如实,不硬凑): #11 省力/MDL 防假关节 在单微波炉上未能干净隔离关节(P3-SAM 无门区 + 低模门面不连通)→ 记不显著,需多关节基准重验。
本轮自查抓到并修掉的 bug(3D 渲染/度量):凸包判穿模结论反了→改 fcl;fcl 布尔永远碰撞(共享铰链接缝)→改各 link 独立 obj;fcl 标量被 rest 重叠污染(0.435/0.435)→去假数改几何直观;门被材质覆盖渲成灰→剥材质让绿/红显示。
【免】不验的 6 类:对称定轴/几何修复保行程(依赖几何太脆)、闭链(太难且搁置)、动力学参数(非本项目)、场景约束(已被#3覆盖)、纯prompt几何一致/视频先验(要跑重模型)。

报告 reports/EPPUR_GRAVEYARD_VALIDATION_20260627.md · 代码/图 EPPUR/experiments/validation_20260627/{figs3d,figs_all}/ · 相关 切门 + GT 隔离实验