Dify智能体三语文档一致性检查工作流

04912

小编

1个月前更新

📝 三语文档一致性检查工作流

该工作流是一个为多语言文档（中文、英文、日文）进行自动化内容一致性校对和修正的专业工具。它的核心功能是：用户指定一个“基准语言”版本后，工作流会自动抓取三个语言版本的在线文档，并以基准版本为准绳，利用大语言模型（LLM）逐一检查其他语言版本的翻译准确性、内容完整性和语言表达地道性，最后以“修订标记”的形式输出检查结果。

第一阶段：用户输入与并行文档抓取

指定任务 (开始): 用户需要提供两个信息：
- URL后缀: 想要检查的文档在特定GitHub仓库中的路径，例如 getting-started/intro.md。
- 基准语言: 从中文、英文、日文中选择一个作为内容校对的“唯一标准”。
并行抓取 (Jina Reader): 工作流会根据用户提供的URL后缀，同时从 Dify-Docs 的 GitHub 仓库中抓取三个语言版本的Markdown文档原文。
- 抓取中文文档: 从 .../zh_CN/ 路径下获取。
- 抓取英文文档: 从 .../en/ 路径下获取。
- 抓取日文文档: 从 .../jp/ 路径下获取。

第二阶段：内容预处理与基准设定

内容提取 (代码节点): 从 Jina Reader 返回的复杂JSON数据中，三个独立的“处理”节点会分别解析并提取出纯净的Markdown文本内容。
设定基准版本 (基准语言设置): 这是一个关键的调度节点。它会收集齐三个语言版本的文档内容，然后根据用户在第一步选择的基准语言，将对应语言的文档内容单独输出，作为后续所有比较的“标准答案”。

第三阶段：并行AI校对与修订

这是工作流的核心处理环节。三个独立的大语言模型（LLM）节点会并行启动，分别扮演对应语言的“文档审核专家”角色。

中文检查 (LLM):
- 接收“中文文档”和“基准版本”的内容。
- AI 任务: LLM 被要求将中文版与基准版对比，找出漏翻译、错翻译的内容，修正语法错误，并将不地道的表达替换为更专业的表达。
- 标记修订: 所有建议的修改都必须使用 <rm>删除内容</rm> 和 <add>添加内容</add> 的XML格式标签进行标记。
- 条件逻辑: 如果用户选择的基准语言本身就是“中文”，则该节点会直接输出原文，不做任何修改。
英文检查 (LLM):
- 接收“英文文档”和“基准版本”的内容，并执行与“中文检查”完全相同的逻辑，但针对的是英文内容。
日文检查 (LLM):
- 接收“日文文档”和“基准版本”的内容，并执行与“中文检查”完全相同的逻辑，但针对的是日文内容。

第四阶段：汇总输出

输出结果 (结束): 该节点会汇集上述三个AI专家（中文、英文、日文检查LLM）的校对结果，并将它们作为三个独立的文本（cn, en, jp）一次性输出给用户。

主要特点

基准驱动校对: 允许用户动态选择任一语言作为“事实标准”，为多语言同步提供了极大的灵活性。
并行处理架构: 同时抓取并处理三个语言版本，极大地提高了校对效率。
专家级AI审查: 通过精细的Prompt指令，让AI模拟文档专家的工作，不仅检查字面错误，还优化语言表达的专业性和地道性。
“修订追踪”式输出: 使用清晰的 <add> 和 <rm> 标签来标记修改，输出结果一目了然，便于人工审核和采纳。
智能逻辑判断: 内置条件判断，确保作为基准的源语言文档本身不会被错误地修改，保证了校对源的纯净性。

重要提示

此工作流高度定制化，其抓取地址硬编码指向了 langgenius/dify-docs 的GitHub仓库，不适用于其他项目。
工作流的正常运行依赖于配置正确的 openai_api_compatible 大语言模型服务（如 claude-3-5-sonnet）以及Jina Reader工具。
最终的输出是三份带有修订建议标记的文档，而非直接修改好的最终文档，需要人工进行最后一步的确认和整合。

文章版权归作者所有，未经允许请勿转载。

THE END