![图片[1]-Dify诗歌音画作品生成器AI工作流-AI应用集](https://aiseek.oss-cn-shanghai.aliyuncs.com/2025/10/截屏2025-10-04-11.57.46-1024x572.png)
![图片[2]-Dify诗歌音画作品生成器AI工作流-AI应用集](https://aiseek.oss-cn-shanghai.aliyuncs.com/2025/10/截屏2025-10-04-11.55.52-1024x427.png)
📜 AI 诗歌音画作品生成器
该工作流扮演了一位集诗人、画家、朗诵家和设计师于一身的 AI 艺术家。用户只需提出一个简单的要求(如“模仿李白的风格”),它就能自动创作一首古诗词,并围绕这首诗,同步生成一幅意境封面图和一段真人质感的语音朗诵,最终将图、文、声整合为一份精美的多媒体作品呈现给用户。
- AI 诗人创作诗句
- 工作流启动时,会接收用户的自然语言指令。
- 一个扮演“唐诗宋词专家”的大语言模型(LLM)会首先根据用户的要求,创作一首全新的、符合指定风格的原创诗句。这句诗是后续所有创作的核心。
- 并行生成音画素材
- 诗句创作完成后,工作流会兵分三路,并行地调用不同的 AI 服务:
- 分支一:生成语音播报
- 诗句文本会被发送到一个文本转语音(TTS)的 API 服务。
- 该服务会将诗句转换成一段音频,并由一个代码节点将其封装成一个可直接在页面播放的 HTML 音频播放器。
- 分支二:生成意境背景图
- 同时,诗句文本也会被发送到一个文生图(Text-to-Image)的 API 服务(如 Kolors)。
- 该服务会根据诗句的意境,生成一幅与之匹配的背景图片,并返回图片 URL。
- 合成诗句封面
- 这是工作流中最精巧的一步。一个“HTTP 请求”节点会扮演“设计师”的角色。
- 它会调用一个专业的图像渲染服务(
api.imgrender.cn
),并向其提交一份详细的“设计简报”,内容包括:- 使用分支二生成的背景图 URL。
- 将第一步创作的诗句文本以指定的字体、大小、颜色和位置,叠加在背景图之上。
- 在画面的角落添加一个二维码。
- 渲染服务完成后,会返回一张全新的、图文并茂的**“诗句封面”图片**。
- 整合与呈现作品
- 最后,“直接回复”节点会将两个关键成果进行整合:
- 第三步合成的**“诗句封面”**(以 Markdown 图片格式展示)。
- 第一分支生成的**“语音播报”**(以 HTML 音频播放器形式展示)。
- 最终,用户会得到一张精美的诗句海报,并可以直接点击播放这首诗的朗诵。
- 最后,“直接回复”节点会将两个关键成果进行整合:
主要特点
- 多媒体内容生成:能够一站式地输出文本(诗句)、音频(朗诵)、图片(背景图)和合成图(封面),实现了多种内容形态的协同创作。
- 多 API 协同工作:工作流像一个总指挥,高效地调度了多个不同领域的第三方 API 服务(文案生成、语音合成、图像生成、图像渲染),共同完成一个复杂的创意任务。
- 并行处理流程:音频和背景图的生成是同步进行的,有效缩短了整个作品的交付时间。
- 动态图像合成:通过调用图像渲染服务,实现了将 AI 生成的文字和图片进行二次创作和动态排版,产出更具设计感的最终作品。
- 完整的艺术体验:最终交付的不是零散的素材,而是一个集“可读、可视、可听”于一体的完整艺术体验。
非常适合用于社交媒体内容创作、个性化贺卡制作、诗词教学辅助以及任何希望以更丰富、更具感染力的方式来呈现文字内容的场景。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容