Dify智能体对话型播客ai工作流-AI应用集

🎙️ AI 文稿转对话式播客生成器

该工作流是一个全自动的播客制作流水线。它能将用户上传的任意文档（如文章、报告）转换成一期由两位主持人（主播和嘉宾）自然对话的播客音频，并且支持高度定制化，包括播客的整体基调、主持人的名字和播客语言。

上传文稿与播客定制
- 用户在开始节点上传一份文档文件（file）作为播客的核心材料。
- 同时，用户需要设定播客的基调（tone），如轻松、严肃或教育等，并自定义主持人（host_name）和嘉宾（guest_name）的姓名，以及播客的语言（language）。
AI 制作人分析与构思
- 首先，“文档提取器”会解析文件内容。
- 接着，第一个 AI 模型（LLM）将扮演“世界级播客制作人”的角色，深入分析文稿，识别出关键主题和有趣观点，并在内部进行头脑风暴，构思如何用引人入胜的方式（如类比、讲故事）来呈现这些内容。
生成多段式对话脚本
- 第二个 AI 模型会利用上一步的构思，创作播客的核心对话部分。它会严格模拟真⼈对话，让主持人和嘉宾交替发言，甚至会加入“呃”、“嗯”等语气词来增加真实感。
- 随后，第三个 AI 模型会专门为这段对话创作一个自然的结尾部分，总结关键见解，并以发人深省的方式收尾。
拼接完整剧本并生成音频
- 模版拼接节点会将“核心对话”和“结尾”两部分脚本无缝拼接成一个完整的播客剧本。
- 在向用户显示一条“播客正在生成，请耐心等待…”的提示后，工作流会将完整剧本送入播客生成工具。
- 该工具会调用文本转语音（TTS）模型，逐行将脚本转换成语音，并为两位主持人分配不同的声音，最终合成为一个完整的、双人对话的音频文件。
输出最终播客音频
- 工作流的最后一步，会将最终生成的音频文件直接呈现给用户，用户可以立即收听这期根据他们的文档定制的播客节目。