针对 box-like 样本里最难的第二个 part,系统比较 5 组 crop/context 配置。目标不是泛泛看图,而是用 first-pass success、mesh/target IoU 和 effective canvas scale 去找出真正能把困难小 part 拉起来的输入策略。
这是目前最关键的一次 probe。baseline_dim 失败;而 white_zoom、transparent_zoom、dim_lowalpha_zoom、transparent_wide 全部一次成功。最佳配置是 white_zoom:padding=0.10、white background、fill=0.88,IoU=0.6200。结论很直接:真正有效的杠杆是让困难小 part 在 TRELLIS 输入里更大、更干净,而不是继续主要折腾 3D box 去重叠。