n8n使用 Qdrant、大模型构建税法助手工作流

n8n使用 Qdrant、大模型构建税法助手工作流

图片[1]-n8n使用 Qdrant、大模型构建税法助手工作流-AI应用集
图片[2]-n8n使用 Qdrant、大模型构建税法助手工作流-AI应用集

这个 n8n 工作流程构建了创建知识库助手的另一个示例,但展示了如何采用更慎重、更有针对性的数据提取方法为您的聊天机器人产生更好的结果。

本例中使用的是一份政府税法政策文件。虽然我们可以按内容长度将文档拆分成多个块,但我们经常会丢失用户可能需要的章节上下文。

我们的方法是先将文档拆分成章节,然后再导入到向量存储中。此外,正确使用元数据是实现过滤和范围查询的关键。

例子

人类:“请告诉我税法对有意商业运输的货物是怎样规定的?”

AI:“德克萨斯州财产税法典第 11.25 条涉及‘专门用于国际贸易的海运货物集装箱’。在本节中,外国公民或企业……”

工作原理

  • 税法政策文件以 zip 文件的形式从政府网站下载,并将其页面提取为单独的章节。
  • 然后使用数据操作表达式对每一章进行解析并将其拆分成各个部分。
  • 然后将每个部分插入到我们的 Qdrant 矢量存储中,并标记其来源、章节和部分编号作为元数据。
  • 当我们的 AI 代理需要从向量存储中检索数据时,我们使用自定义工作流工具对 Qdrant 执行查询。
  • 因为我们依赖于 Qdrant 的高级过滤功能,所以我们使用 Qdrant API 而不是 Qdrant 节点执行搜索。
  • 当 AI 代理需要提取完整文本或摘录时,我们可以使用 Qdrant 的滚动 API 和元数据过滤功能。这使得 Qdrant 就像我们文档的键值存储一样。

要求

  • 矢量存储需要 Q​​drant 实例,特别是它的过滤功能。
  • Mistral.ai负责嵌入和 AI 模型。

自定义此工作流程

根据您的使用情况,考虑将实际的 PDF 页面(或链接)返回给用户以获得额外的确认并建立信任。

不使用 Mistral?您可以替换,但请注意,Qdrant 集合的距离和尺寸大小要与您选择的嵌入模型相匹配。

© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容