![图片[1]-Dify智能体智能全网搜索与摘要工作流-AI应用集](https://aiseek.oss-cn-shanghai.aliyuncs.com/2025/10/截屏2025-10-04-12.55.55-1024x576.png)
![图片[2]-Dify智能体智能全网搜索与摘要工作流-AI应用集](https://aiseek.oss-cn-shanghai.aliyuncs.com/2025/10/截屏2025-10-04-12.55.08-1024x584.png)
🌐 智能全网搜索与摘要工作流
该工作流是一个高度自动化的AI 研究助理,旨在模拟人类研究员的工作流程。它的核心功能是,接收用户提出的一个问题,通过 Exa.ai 搜索引擎进行实时全网搜索,然后逐一访问和总结搜索到的网页内容,并最终以流式的方式,将格式化好的摘要和来源链接逐条呈现给用户。
优化查询与限定范围
在正式搜索之前,工作流会先对用户的输入进行智能预处理,以提升搜索结果的质量:
- LLM 优化查询:一个大语言模型(LLM)节点会首先分析用户原始、可能模糊的问题,并将其改写成一个更具体、更适合搜索引擎的精确查询。
- 代码节点设定时间:一个代码节点会自动生成一个时间范围(例如:过去60天),确保搜索到的信息具有时效性。
执行主搜索并提取结果
经过优化的查询和时间范围,会被组装成一个 JSON 请求体,然后通过“HTTP 请求”节点发送给 Exa.ai 的搜索 API。
- 获取链接列表:API 会返回一个包含多个(此工作流设定为6个)相关网页的列表,每个条目包含网页的标题、URL 等元数据。
- 解析结果:一个代码节点会解析返回的 JSON 数据,将网页列表提取出来,为下一步的逐一处理做准备。
迭代处理每一条搜索结果
这是工作流最核心的部分。它使用一个“迭代”节点,对上一步获取到的每一个网页链接,循环执行一套完整的“阅读-总结-格式化”流程:
- 提取链接与标题:在循环的开始,一个代码节点会从当前处理的条目中提取出标题和 URL,并将其格式化为 Markdown 链接。
- 获取原文摘要:工作流再次使用“HTTP 请求”节点,这次调用 Exa.ai 的
/contents
API,传入当前网页的 URL,以获取该网页的详细内容或由 AI 生成的摘要。 - 二次精炼摘要:获取到的网页内容会被送入另一个 LLM 节点进行二次提炼。这个 LLM 的任务是生成一个更简短、更精炼的核心摘要。
- 格式化输出:“模板转换”节点会将 Markdown 链接、精炼后的摘要,以及一个进度指示(例如 “NO.1 … 1/6”)组合成一个格式优美的文本块。
流式输出,即时反馈
该工作流的一个精妙设计是,“直接回复”节点被放置在了“迭代”循环的内部。
- 逐条展示:这意味着,每当一个网页的处理流程完成时,其结果会立刻被发送给用户,而无需等待所有6个网页全部处理完毕。这为用户提供了一种动态、实时的“流式”体验,可以一边看已有的结果,一边等待后续的结果生成。
主要特点
- 双层 API 调用:采用了“先搜列表,再逐一获取内容”的二级请求模式,实现了对信息深度的挖掘,而非简单的表面搜索。
- 流式迭代输出:通过将回复节点置于循环体内,实现了结果的逐条实时输出,极大地改善了用户等待体验,让交互过程更像一个动态的研究过程。
- 查询预处理:在搜索前通过 LLM 优化查询、通过代码限定时间范围,这些预处理步骤有效保证了搜索结果的精准度和时效性。
- 多步内容精炼:对每个网页内容都进行了“Exa.ai 初步摘要 + LLM 二次精炼”的两步处理,确保最终呈现给用户的是高质量、高浓度的信息摘要。
- 完整的自动化研究链路:从理解问题、优化问题、全网搜索、深度阅读、总结归纳到格式化呈现,完整地模拟并自动化了人类研究员的基础工作流程。
重要提示
此工作流的运行需要配置有效的 Exa.ai 的 API 密钥。最终的搜索质量和内容摘要效果,依赖于 Exa.ai 搜索引擎的能力。
非常适合用于构建需要实时网络信息的AI 研究助理、新闻分析、竞品追踪或任何需要对多个信息源进行快速汇总和报告的应用场景。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容