Dify智能体儿童故事绘本文生视频语音合成版-AI应用集

🎬 AI 全流程儿童故事动画视频生成器

该工作流是一个高度参数化的“总控台”，它允许用户像导演一样，通过精细配置各项参数，向一个强大的后端服务下达生产指令，从而全自动地生成一部完整的、图文并茂、带旁白配音的儿童故事动画视频。

详细参数配置
- 工作流的起点是一个极为详尽的配置面板。用户需要在这里设定故事主题（prompt）、分镜数量（segments）、语言（language）、配音员（voice_name）、语速（voice_rate）、图片分辨率（resolution），甚至可以选择具体由哪个厂商的哪个文本大模型和文生图大模型来执行创作。
发送生产指令到后端
- “HTTP 请求”节点是这个工作流的核心。它会将用户在第一步中配置的所有参数，整合成一个结构化的 JSON 数据包。
- 接着，它会带着认证密钥（apikey），将这个 JSON “生产订单”作为一个 POST 请求，发送给一个专门处理此任务的后端服务器接口。
云端全流程处理（后端执行）
- 工作流本身不执行故事创作、分镜设计、AI 绘画和语音合成等复杂任务。所有这些“重活”都在接收到指令的后端服务器上完成。
- 后端服务会根据接收到的详细参数，按部就班地完成：1. 故事扩写 -> 2. 智能分镜 -> 3. 图片生成 -> 4. 文本配音 -> 5. 将图片和对应的配音合成为一个动画视频。
接收并展示成品视频
- Dify 工作流在发送指令后会等待后端服务器处理完毕。服务器完成后，会返回一个包含最终视频文件 URL 的 JSON 响应。
- “代码执行”节点会解析这个响应，提取出 video_url，并将其封装成一个可以在网页中直接播放的 HTML <video> 标签。
- 最终，“直接回复”节点会将这个嵌入式的视频播放器呈现给用户，用户可以直接在聊天界面中观看生成的儿童故事动画视频。