![图片[1]-n8n使用 Qdrant、大模型构建税法助手工作流-AI应用集](https://aiseek.oss-cn-shanghai.aliyuncs.com/2025/10/截屏2025-10-01-21.24.03-1024x574.png)
![图片[2]-n8n使用 Qdrant、大模型构建税法助手工作流-AI应用集](https://aiseek.oss-cn-shanghai.aliyuncs.com/2025/10/截屏2025-10-01-21.24.16-1024x654.png)
这个 n8n 工作流程构建了创建知识库助手的另一个示例,但展示了如何采用更慎重、更有针对性的数据提取方法为您的聊天机器人产生更好的结果。
本例中使用的是一份政府税法政策文件。虽然我们可以按内容长度将文档拆分成多个块,但我们经常会丢失用户可能需要的章节上下文。
我们的方法是先将文档拆分成章节,然后再导入到向量存储中。此外,正确使用元数据是实现过滤和范围查询的关键。
例子
人类:“请告诉我税法对有意商业运输的货物是怎样规定的?”
AI:“德克萨斯州财产税法典第 11.25 条涉及‘专门用于国际贸易的海运货物集装箱’。在本节中,外国公民或企业……”
工作原理
- 税法政策文件以 zip 文件的形式从政府网站下载,并将其页面提取为单独的章节。
- 然后使用数据操作表达式对每一章进行解析并将其拆分成各个部分。
- 然后将每个部分插入到我们的 Qdrant 矢量存储中,并标记其来源、章节和部分编号作为元数据。
- 当我们的 AI 代理需要从向量存储中检索数据时,我们使用自定义工作流工具对 Qdrant 执行查询。
- 因为我们依赖于 Qdrant 的高级过滤功能,所以我们使用 Qdrant API 而不是 Qdrant 节点执行搜索。
- 当 AI 代理需要提取完整文本或摘录时,我们可以使用 Qdrant 的滚动 API 和元数据过滤功能。这使得 Qdrant 就像我们文档的键值存储一样。
要求
- 矢量存储需要 Qdrant 实例,特别是它的过滤功能。
- Mistral.ai负责嵌入和 AI 模型。
自定义此工作流程
根据您的使用情况,考虑将实际的 PDF 页面(或链接)返回给用户以获得额外的确认并建立信任。
不使用 Mistral?您可以替换,但请注意,Qdrant 集合的距离和尺寸大小要与您选择的嵌入模型相匹配。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容