![图片[1]-dify智能体儿童故事播客ai工作流-AI应用集](https://aiseek.oss-cn-shanghai.aliyuncs.com/2025/10/截屏2025-10-03-21.25.20-1024x574.png)
![图片[2]-dify智能体儿童故事播客ai工作流-AI应用集](https://aiseek.oss-cn-shanghai.aliyuncs.com/2025/10/截屏2025-10-03-21.24.23-1024x548.png)
🎨 AI 全自动儿童有声绘本生成器
该工作流是一个高度集成化的内容生产线,能将用户的一个简单想法,全自动地扩展、创作、并最终生成一本完整的多分镜、带插图、带旁白配音的数字有声绘本。
输入故事主题与分镜数
用户在开始节点输入一个故事主题(
prompt
),并从下拉菜单中选择这本绘本希望包含的分镜数量(promptCount
),即有多少页带插图的场景。
AI 创作故事初稿
第一个大语言模型(LLM)会根据用户的主题,创作一篇 200-300 字的、富有想象力的儿童故事短文,作为整个绘本的文字基础。
AI 插画师规划分镜与提示词
接下来,第二个扮演“儿童绘本插画师和 AI 绘画提示词专家”的 LLM 会介入。
它会把第一步生成的故事,按照用户指定的分镜数量,智能地拆分成多个场景。对每一个场景,它都会生成一个结构化的 JSON 对象,其中包含:场景描述、为保证角色形象和画风一致而精心设计的超详细绘画 Prompt、以及该画面对应的故事文字片段(
text_snippet
)。
云端服务生成音画资源
包含所有分镜规划的 JSON 数据包,会通过一个 HTTP 请求节点,被发送到一个外部的云端服务器。
这个外部服务器会接收这些指令,并执行计算密集型任务:为每一个分镜生成对应的插图和旁白音频。
完成后,服务器会返回一个新的 JSON 数据包,其中包含了每个分镜的图片 URL 和音频 URL。
整合与排版生成绘本
最后一个 Python 代码节点会接收从服务器返回的、包含所有图片和音频链接的数据。
它会自动遍历每一个分镜的数据,将它们格式化成一段精美的 Markdown 文本。每个分镜都会显示其描述、插图(通过
![]()
标签)以及一个可播放的音频条(通过<audio>
标签)。最终,“回复”节点会将这段排版好的、图文并茂、有声有色的完整数字绘本呈现给用户。
主要特点
端到端绘本生成:真正实现了从一个“想法”到一本“有声绘本”的完整自动化链路,覆盖了文案、分镜、绘画、配音和排版的全过程。
专业分镜与提示词工程:工作流中的第二个 AI 扮演了艺术总监的角色,通过结构化的提示词确保了整本绘本在角色和风格上的高度一致性。
云端服务集成:巧妙地将文案创作(本地 AI)与资源生成(外部云服务)分离,通过 API 调用来完成绘图和配音等重度计算任务,架构非常先进。
多媒体动态排版:最终的成品不是一堆零散的文件,而是一个动态组合、排版精良的 Markdown 页面,提供了极佳的阅读和收听体验。
高度自动化与结构化:整个流程依赖于结构化数据(JSON)在不同模块间的精确传递,实现了极高的自动化水平。
非常适合希望能快速将创意转化为完整绘本作品的儿童文学作者、插画师、教育机构以及希望为孩子定制高质量个性化有声读物的家长。
暂无评论内容