n8n使用 Mistral OCR  解析 PDF、DOCX 和图像ai工作流

n8n使用 Mistral OCR 解析 PDF、DOCX 和图像ai工作流

图片[1]-n8n使用 Mistral OCR  解析 PDF、DOCX 和图像ai工作流-AI应用集
图片[2]-n8n使用 Mistral OCR  解析 PDF、DOCX 和图像ai工作流-AI应用集
  • 监控 Google Drive 文件夹,将 PDF、DOCX 和图像文件解析到目标文件夹中,准备进行进一步处理(例如 RAG 提取、翻译等)
  • 继续在 Google Sheet 中处理日志并发送 Slack 通知。

工作原理

  • 触发器:查看 Google Drive 文件夹中的新文件和更新文件。
  • 创建一个唯一命名的目标文件夹,复制输入文件。
  • 使用 Mistral Document 解析文件,提取内容并分别处理不可 OCR 的图像。
  • 将 Mistral Document 返回的数据保存到目标 Google Drive 文件夹(原始 JSON 文件、Markdown 文件和图像)以供进一步处理。

如何使用

  • Google Drive 和 Google Sheets 节点:
    • 创建可访问 Google 云端硬盘和 Google 表格的 Google 凭据。了解更多关于 Google 凭据的信息
    • 更新所有Google Drive 和 Google Sheets 节点(共 14 个节点)以使用凭据
  • 米斯特拉尔节点:
  • Slack 节点:
    • 创建 Slack OAuth2 凭证。了解更多关于 Slack OAuth2 凭证的信息
    • 更新两个 Slack 节点:Send Success MessageSend Error Message
      • 设置凭据
      • 选择您想要发送通知的频道(成功和错误的频道可以不同)。
  • 按照 中的步骤创建 Google Sheets 电子表格Google Sheets Configuration。确保可以Editor使用上述 Google 凭据使用的帐户访问该电子表格。
  • 为输入文件创建一个目录,为输出文件夹/文件创建一个目录。确保 Google 凭据使用的帐户可以访问这些目录。
  • 按照绿色注释中的步骤更新File CreatedFile Updated和节点。Workflow Configuration

要求

  • 具有 Google API 访问权限的 Google 帐户
  • Mistral Cloud 帐户访问 Mistral API 密钥。
  • 可以访问 Slack 客户端 ID 和秘密 ID 的 Slack 帐户。
  • 基本的 n8n 知识:了解触发器、表达式和凭证管理

适合谁

任何构建数据管道的人都会摄取需要 OCR 处理的文件,以便进行进一步处理。

🔒 安全

所有凭证均以 n8n 凭证形式存储。此工作流中存储的唯一可能被视为敏感的信息是 Google Drive 目录和工作表 ID。这些目录和电子表格应根据您的需求进行安全保护。

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容