专门拿最棘手的 box-like 样本做条件清洗实验。我们把原本重叠严重的 3D boxes 用 split_midpoint 规则拆开,再走同一条正式 TRELLIS2 per-part 生成链,检查 overlap risk、retry burden 和最终装配会不会一起改善。
这是一次很有价值的负例对照。cleanup 把 overlap_risk 从 0.5469 降到了 0,但 retry_burden 仍是 1,decode_stability 仍是 0.6667。也就是说,条件歧义被清掉了,但最难的第二个 part 仍然需要 retry,说明真正的瓶颈已经更靠近 crop / decode 本身。