dify智能体儿童故事播客ai工作流-AI应用集

🎨 AI 全自动儿童有声绘本生成器

该工作流是一个高度集成化的内容生产线，能将用户的一个简单想法，全自动地扩展、创作、并最终生成一本完整的多分镜、带插图、带旁白配音的数字有声绘本。

输入故事主题与分镜数
- 用户在开始节点输入一个故事主题（prompt），并从下拉菜单中选择这本绘本希望包含的分镜数量（promptCount），即有多少页带插图的场景。
AI 创作故事初稿
- 第一个大语言模型（LLM）会根据用户的主题，创作一篇 200-300 字的、富有想象力的儿童故事短文，作为整个绘本的文字基础。
AI 插画师规划分镜与提示词
- 接下来，第二个扮演“儿童绘本插画师和 AI 绘画提示词专家”的 LLM 会介入。
- 它会把第一步生成的故事，按照用户指定的分镜数量，智能地拆分成多个场景。对每一个场景，它都会生成一个结构化的 JSON 对象，其中包含：场景描述、为保证角色形象和画风一致而精心设计的超详细绘画 Prompt、以及该画面对应的故事文字片段（text_snippet）。
云端服务生成音画资源
- 包含所有分镜规划的 JSON 数据包，会通过一个 HTTP 请求节点，被发送到一个外部的云端服务器。
- 这个外部服务器会接收这些指令，并执行计算密集型任务：为每一个分镜生成对应的插图和旁白音频。
- 完成后，服务器会返回一个新的 JSON 数据包，其中包含了每个分镜的图片 URL 和音频 URL。
整合与排版生成绘本
- 最后一个 Python 代码节点会接收从服务器返回的、包含所有图片和音频链接的数据。
- 它会自动遍历每一个分镜的数据，将它们格式化成一段精美的 Markdown 文本。每个分镜都会显示其描述、插图（通过![]()标签）以及一个可播放的音频条（通过<audio>标签）。
- 最终，“回复”节点会将这段排版好的、图文并茂、有声有色的完整数字绘本呈现给用户。