RemoveSegID / SegIDClean & Reflow 使用说明——ATR 最后一公里清理工具 v1.0
第 16 批现代化日期：2026 年 4 月 28 日
状态：实时可用的操作说明章节

PURPOSE（目的）
当清理从 ATR 翻译 / 审校提示词导出的文本时使用本节。这些导出文本可能包含 SegID headers、PARA markers、Clean Copy banners、QA headings 或 citation crumbs。

这是最后一公里清理工作流。不得用它来改写、翻译、摘要或改变译文意义。

LEGACY PRESERVED QUICK WORKFLOW（保留旧版快速工作流程）
旧工作流指示用户：

1. 复制已审校的 Clean Copy 输出。
2. 粘贴到 Notepad 文件。
3. 保存为 UTF-8 .txt 文件。
4. 解压并从 RemoveSegID.zip 运行 RemoveSegID.exe。
5. 使用旧工具时选择 Mode 3。
6. 将 .txt 文件拖放到 console window 中，而不是手动输入路径。
7. 按 Enter。
8. 使用在源文件旁边生成的 cleaned output file，例如 filename_cleaned.txt。

CURRENT SEGIDCLEAN & REFLOW WORKFLOW（当前 SegIDClean & Reflow 工作流程）
可用时，优先使用较新的 SegIDClean & Reflow 工具。

预期功能：

- 移除 SegID headers / prefixes，无论是否带尾随句点或冒号；
- 移除 “Clean Copy” banners 和 QA / report headings；
- 删除 inline citation crumbs，例如 [ISO][1] 或 Wikipedia+2，前提是它们是 artifact 而非源文内容；
- 使用 PARA / SegID markers 保留段落断点；
- 折叠多余空行；
- 在源文件旁写出 cleaned file，例如 draft.cleaned.txt；
- 如果存在 PARA markers，则生成第二轮输出，把原始段落恢复成连续 prose，例如 draft.cleaned.reflowed.txt。

SAFETY BOUNDARY（安全边界）
清理工具只编辑导出文本。绝不能把它视为源文翻译的权威。

不要使用 cleanup 来：

- 修复误译；
- 删除困难内容；
- 合并本应分开的章节；
- 在没有 reflow basis 的情况下抹去原始段落结构；
- 删除引文或来源标签；
- 删除真正属于文章内容的脚注；
- 删除有意保留的 bracketed translator notes，例如【译按：…】；
- 删除原文脚本引文；
- 删除有意的 stage labels、speaker labels 或 headings。

BEFORE CLEANUP（清理前）
确认：

1. 翻译 / 审校输出是完整的。
2. Clean Copy region 是要清理的目标区域。
3. 文件已保存为 UTF-8 文本。
4. 文件扩展名为 .txt，除非工具明确支持其他格式。
5. 你有 pre-cleaned file 的副本。
6. 若存在 PARA markers，它们是一致的。
7. SegID markers 不是 meaningful source text 的一部分。

AFTER CLEANUP QA（清理后 QA）
打开 cleaned file 并检查：

- 标题存在；
- 第一段存在；
- 中间章节存在；
- 最后一段存在；
- 没有章节被静默删除；
- 段落没有被折叠成一个难读的大块；
- 诗 / 偈 / 列表没有丢失有意行分隔；
- 引文和来源标签保留；
- diacritics 保留完整；
- 中文字符保留完整；
- 如果有 links，链接保持完整；
- 除非有意保留，否则 QA-report headings 不再残留；
- 除非有意保留，否则 SegID / PARA markers 不再残留。

WHEN TO USE THE REFLOWED OUTPUT（何时使用 reflowed 输出）
在以下情况使用 .reflowed 输出：

- PARA markers 被正确使用；
- 你想要以原段落重构的 continuous prose；
- 输出将被粘贴进普通文章、书籍或博客文章。

在以下情况，不要未经检查就使用 reflowed 输出：

- 文本包含 verse、gāthās、poetry、transcript lineation、tables、code 或 prompt bodies；
- 换行承载意义；
- 源文使用有意的短独立行；
- 清理结果在视觉上改变结构。

WHEN TO RETURN TO PROMPT 6 / PROMPT 9 INSTEAD（何时应回到 Prompt 6 / Prompt 9）
如果 cleaned text 暴露缺失段落、误译、术语不一致、引文破损、段落不佳或教义错误，不要继续机械清理。回到 Prompt 6 做审校，或回到 Prompt 9 做源文锚定精修。

SIMPLIFIED / TRADITIONAL CHINESE CONVERSION NOTE（简繁转换说明）
如果使用独立的 Simplified-to-Traditional / Traditional-to-Simplified converter：

1. 将其视为字符转换，不是翻译。
2. 转换后检查佛教技术术语。
3. 检查 proper nouns、names、Sanskrit / Pāli / Tibetan transliterations 和 quoted classical passages。
4. 不要假定自动转换能保留地域术语偏好。
5. 保留 pre-conversion file 的副本。

FINAL STATUS（最终状态）
只有打开并检查 cleaned file 后，cleanup step 才算完成。不要仅仅因为工具生成了输出文件，就宣称最终文本已清理干净。
