把 PAct 论文附录 D 里描述的 `VLM-guided prompting pipeline followed by SAM2 refinement` 真正补成本地可运行链路。该页面展示 `Dishwasher_001` 的 Stage 0 granularity、SAM2 候选、Stage 1 articulated/fixed 分类、Stage 2 semantic merge,以及最终导出的 PAct `mask.exr`。
这次不是直接改 PAct 主推理,而是把论文附录 D 的前处理链补齐。真实产物已经落下:Stage 0 选择 `medium` granularity;SAM2 切出 4 个候选;VLM 最终把 `segment 0` 识别并保留为 `door(articulated)`,把 `segments 1/2/3` 合并成 `main_body(fixed)`。