Dify诗歌音画作品生成器AI工作流-AI应用集

📜 AI 诗歌音画作品生成器

该工作流扮演了一位集诗人、画家、朗诵家和设计师于一身的 AI 艺术家。用户只需提出一个简单的要求（如“模仿李白的风格”），它就能自动创作一首古诗词，并围绕这首诗，同步生成一幅意境封面图和一段真人质感的语音朗诵，最终将图、文、声整合为一份精美的多媒体作品呈现给用户。

AI 诗人创作诗句
- 工作流启动时，会接收用户的自然语言指令。
- 一个扮演“唐诗宋词专家”的大语言模型（LLM）会首先根据用户的要求，创作一首全新的、符合指定风格的原创诗句。这句诗是后续所有创作的核心。
并行生成音画素材
- 诗句创作完成后，工作流会兵分三路，并行地调用不同的 AI 服务：
- 分支一：生成语音播报
  - 诗句文本会被发送到一个文本转语音（TTS）的 API 服务。
  - 该服务会将诗句转换成一段音频，并由一个代码节点将其封装成一个可直接在页面播放的 HTML 音频播放器。
- 分支二：生成意境背景图
  - 同时，诗句文本也会被发送到一个文生图（Text-to-Image）的 API 服务（如 Kolors）。
  - 该服务会根据诗句的意境，生成一幅与之匹配的背景图片，并返回图片 URL。
合成诗句封面
- 这是工作流中最精巧的一步。一个“HTTP 请求”节点会扮演“设计师”的角色。
- 它会调用一个专业的图像渲染服务（api.imgrender.cn），并向其提交一份详细的“设计简报”，内容包括：
  - 使用分支二生成的背景图 URL。
  - 将第一步创作的诗句文本以指定的字体、大小、颜色和位置，叠加在背景图之上。
  - 在画面的角落添加一个二维码。
- 渲染服务完成后，会返回一张全新的、图文并茂的**“诗句封面”图片**。
整合与呈现作品
- 最后，“直接回复”节点会将两个关键成果进行整合：
  - 第三步合成的**“诗句封面”**（以 Markdown 图片格式展示）。
  - 第一分支生成的**“语音播报”**（以 HTML 音频播放器形式展示）。
- 最终，用户会得到一张精美的诗句海报，并可以直接点击播放这首诗的朗诵。

主要特点

多媒体内容生成：能够一站式地输出文本（诗句）、音频（朗诵）、图片（背景图）和合成图（封面），实现了多种内容形态的协同创作。
多 API 协同工作：工作流像一个总指挥，高效地调度了多个不同领域的第三方 API 服务（文案生成、语音合成、图像生成、图像渲染），共同完成一个复杂的创意任务。
并行处理流程：音频和背景图的生成是同步进行的，有效缩短了整个作品的交付时间。
动态图像合成：通过调用图像渲染服务，实现了将 AI 生成的文字和图片进行二次创作和动态排版，产出更具设计感的最终作品。
完整的艺术体验：最终交付的不是零散的素材，而是一个集“可读、可视、可听”于一体的完整艺术体验。

非常适合用于社交媒体内容创作、个性化贺卡制作、诗词教学辅助以及任何希望以更丰富、更具感染力的方式来呈现文字内容的场景。

文章版权归作者所有，未经允许请勿转载。

THE END