Dify智能体三语文档一致性检查工作流

Dify智能体三语文档一致性检查工作流

图片[1]-Dify智能体三语文档一致性检查工作流-AI应用集
图片[2]-Dify智能体三语文档一致性检查工作流-AI应用集

📝 三语文档一致性检查工作流

该工作流是一个为多语言文档(中文、英文、日文)进行自动化内容一致性校对和修正的专业工具。它的核心功能是:用户指定一个“基准语言”版本后,工作流会自动抓取三个语言版本的在线文档,并以基准版本为准绳,利用大语言模型(LLM)逐一检查其他语言版本的翻译准确性、内容完整性和语言表达地道性,最后以“修订标记”的形式输出检查结果。

第一阶段:用户输入与并行文档抓取

  • 指定任务 (开始): 用户需要提供两个信息:
    • URL后缀: 想要检查的文档在特定GitHub仓库中的路径,例如 getting-started/intro.md
    • 基准语言: 从中文、英文、日文中选择一个作为内容校对的“唯一标准”。
  • 并行抓取 (Jina Reader): 工作流会根据用户提供的URL后缀,同时从 Dify-Docs 的 GitHub 仓库中抓取三个语言版本的Markdown文档原文。
    • 抓取中文文档: 从 .../zh_CN/ 路径下获取。
    • 抓取英文文档: 从 .../en/ 路径下获取。
    • 抓取日文文档: 从 .../jp/ 路径下获取。

第二阶段:内容预处理与基准设定

  • 内容提取 (代码节点): 从 Jina Reader 返回的复杂JSON数据中,三个独立的“处理”节点会分别解析并提取出纯净的Markdown文本内容。
  • 设定基准版本 (基准语言设置): 这是一个关键的调度节点。它会收集齐三个语言版本的文档内容,然后根据用户在第一步选择的基准语言,将对应语言的文档内容单独输出,作为后续所有比较的“标准答案”。

第三阶段:并行AI校对与修订

这是工作流的核心处理环节。三个独立的大语言模型(LLM)节点会并行启动,分别扮演对应语言的“文档审核专家”角色。

  • 中文检查 (LLM):
    • 接收“中文文档”和“基准版本”的内容。
    • AI 任务: LLM 被要求将中文版与基准版对比,找出漏翻译、错翻译的内容,修正语法错误,并将不地道的表达替换为更专业的表达。
    • 标记修订: 所有建议的修改都必须使用 <rm>删除内容</rm> 和 <add>添加内容</add> 的XML格式标签进行标记。
    • 条件逻辑: 如果用户选择的基准语言本身就是“中文”,则该节点会直接输出原文,不做任何修改。
  • 英文检查 (LLM):
    • 接收“英文文档”和“基准版本”的内容,并执行与“中文检查”完全相同的逻辑,但针对的是英文内容。
  • 日文检查 (LLM):
    • 接收“日文文档”和“基准版本”的内容,并执行与“中文检查”完全相同的逻辑,但针对的是日文内容。

第四阶段:汇总输出

  • 输出结果 (结束): 该节点会汇集上述三个AI专家(中文、英文、日文检查LLM)的校对结果,并将它们作为三个独立的文本(cnenjp)一次性输出给用户。

主要特点

  • 基准驱动校对: 允许用户动态选择任一语言作为“事实标准”,为多语言同步提供了极大的灵活性。
  • 并行处理架构: 同时抓取并处理三个语言版本,极大地提高了校对效率。
  • 专家级AI审查: 通过精细的Prompt指令,让AI模拟文档专家的工作,不仅检查字面错误,还优化语言表达的专业性和地道性。
  • “修订追踪”式输出: 使用清晰的 <add> 和 <rm> 标签来标记修改,输出结果一目了然,便于人工审核和采纳。
  • 智能逻辑判断: 内置条件判断,确保作为基准的源语言文档本身不会被错误地修改,保证了校对源的纯净性。

重要提示

  • 此工作流高度定制化,其抓取地址硬编码指向了 langgenius/dify-docs 的GitHub仓库,不适用于其他项目。
  • 工作流的正常运行依赖于配置正确的 openai_api_compatible 大语言模型服务(如 claude-3-5-sonnet)以及Jina Reader工具。
  • 最终的输出是三份带有修订建议标记的文档,而非直接修改好的最终文档,需要人工进行最后一步的确认和整合。
© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容