![图片[1]-Dify智能体三语文档一致性检查工作流-AI应用集](https://aiseek.oss-cn-shanghai.aliyuncs.com/2025/10/截屏2025-10-04-17.13.37-1024x575.png)
![图片[2]-Dify智能体三语文档一致性检查工作流-AI应用集](https://aiseek.oss-cn-shanghai.aliyuncs.com/2025/10/截屏2025-10-04-17.13.58-1024x526.png)
📝 三语文档一致性检查工作流
该工作流是一个为多语言文档(中文、英文、日文)进行自动化内容一致性校对和修正的专业工具。它的核心功能是:用户指定一个“基准语言”版本后,工作流会自动抓取三个语言版本的在线文档,并以基准版本为准绳,利用大语言模型(LLM)逐一检查其他语言版本的翻译准确性、内容完整性和语言表达地道性,最后以“修订标记”的形式输出检查结果。
第一阶段:用户输入与并行文档抓取
- 指定任务 (开始): 用户需要提供两个信息:
URL后缀
: 想要检查的文档在特定GitHub仓库中的路径,例如getting-started/intro.md
。基准语言
: 从中文、英文、日文中选择一个作为内容校对的“唯一标准”。
- 并行抓取 (Jina Reader): 工作流会根据用户提供的URL后缀,同时从 Dify-Docs 的 GitHub 仓库中抓取三个语言版本的Markdown文档原文。
- 抓取中文文档: 从
.../zh_CN/
路径下获取。 - 抓取英文文档: 从
.../en/
路径下获取。 - 抓取日文文档: 从
.../jp/
路径下获取。
- 抓取中文文档: 从
第二阶段:内容预处理与基准设定
- 内容提取 (代码节点): 从 Jina Reader 返回的复杂JSON数据中,三个独立的“处理”节点会分别解析并提取出纯净的Markdown文本内容。
- 设定基准版本 (基准语言设置): 这是一个关键的调度节点。它会收集齐三个语言版本的文档内容,然后根据用户在第一步选择的
基准语言
,将对应语言的文档内容单独输出,作为后续所有比较的“标准答案”。
第三阶段:并行AI校对与修订
这是工作流的核心处理环节。三个独立的大语言模型(LLM)节点会并行启动,分别扮演对应语言的“文档审核专家”角色。
- 中文检查 (LLM):
- 接收“中文文档”和“基准版本”的内容。
- AI 任务: LLM 被要求将中文版与基准版对比,找出漏翻译、错翻译的内容,修正语法错误,并将不地道的表达替换为更专业的表达。
- 标记修订: 所有建议的修改都必须使用
<rm>删除内容</rm>
和<add>添加内容</add>
的XML格式标签进行标记。 - 条件逻辑: 如果用户选择的基准语言本身就是“中文”,则该节点会直接输出原文,不做任何修改。
- 英文检查 (LLM):
- 接收“英文文档”和“基准版本”的内容,并执行与“中文检查”完全相同的逻辑,但针对的是英文内容。
- 日文检查 (LLM):
- 接收“日文文档”和“基准版本”的内容,并执行与“中文检查”完全相同的逻辑,但针对的是日文内容。
第四阶段:汇总输出
- 输出结果 (结束): 该节点会汇集上述三个AI专家(中文、英文、日文检查LLM)的校对结果,并将它们作为三个独立的文本(
cn
,en
,jp
)一次性输出给用户。
主要特点
- 基准驱动校对: 允许用户动态选择任一语言作为“事实标准”,为多语言同步提供了极大的灵活性。
- 并行处理架构: 同时抓取并处理三个语言版本,极大地提高了校对效率。
- 专家级AI审查: 通过精细的Prompt指令,让AI模拟文档专家的工作,不仅检查字面错误,还优化语言表达的专业性和地道性。
- “修订追踪”式输出: 使用清晰的
<add>
和<rm>
标签来标记修改,输出结果一目了然,便于人工审核和采纳。 - 智能逻辑判断: 内置条件判断,确保作为基准的源语言文档本身不会被错误地修改,保证了校对源的纯净性。
重要提示
- 此工作流高度定制化,其抓取地址硬编码指向了
langgenius/dify-docs
的GitHub仓库,不适用于其他项目。 - 工作流的正常运行依赖于配置正确的
openai_api_compatible
大语言模型服务(如claude-3-5-sonnet
)以及Jina Reader工具。 - 最终的输出是三份带有修订建议标记的文档,而非直接修改好的最终文档,需要人工进行最后一步的确认和整合。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容