Dify诗歌音画作品生成器AI工作流

Dify诗歌音画作品生成器AI工作流

图片[1]-Dify诗歌音画作品生成器AI工作流-AI应用集
图片[2]-Dify诗歌音画作品生成器AI工作流-AI应用集

📜 AI 诗歌音画作品生成器

该工作流扮演了一位集诗人、画家、朗诵家和设计师于一身的 AI 艺术家。用户只需提出一个简单的要求(如“模仿李白的风格”),它就能自动创作一首古诗词,并围绕这首诗,同步生成一幅意境封面图和一段真人质感的语音朗诵,最终将图、文、声整合为一份精美的多媒体作品呈现给用户。

  1. AI 诗人创作诗句
    • 工作流启动时,会接收用户的自然语言指令。
    • 一个扮演“唐诗宋词专家”的大语言模型(LLM)会首先根据用户的要求,创作一首全新的、符合指定风格的原创诗句。这句诗是后续所有创作的核心。
  2. 并行生成音画素材
    • 诗句创作完成后,工作流会兵分三路,并行地调用不同的 AI 服务:
    • 分支一:生成语音播报
      • 诗句文本会被发送到一个文本转语音(TTS)的 API 服务。
      • 该服务会将诗句转换成一段音频,并由一个代码节点将其封装成一个可直接在页面播放的 HTML 音频播放器。
    • 分支二:生成意境背景图
      • 同时,诗句文本也会被发送到一个文生图(Text-to-Image)的 API 服务(如 Kolors)。
      • 该服务会根据诗句的意境,生成一幅与之匹配的背景图片,并返回图片 URL。
  3. 合成诗句封面
    • 这是工作流中最精巧的一步。一个“HTTP 请求”节点会扮演“设计师”的角色。
    • 它会调用一个专业的图像渲染服务(api.imgrender.cn),并向其提交一份详细的“设计简报”,内容包括:
      • 使用分支二生成的背景图 URL
      • 将第一步创作的诗句文本以指定的字体、大小、颜色和位置,叠加在背景图之上。
      • 在画面的角落添加一个二维码
    • 渲染服务完成后,会返回一张全新的、图文并茂的**“诗句封面”图片**。
  4. 整合与呈现作品
    • 最后,“直接回复”节点会将两个关键成果进行整合:
      • 第三步合成的**“诗句封面”**(以 Markdown 图片格式展示)。
      • 第一分支生成的**“语音播报”**(以 HTML 音频播放器形式展示)。
    • 最终,用户会得到一张精美的诗句海报,并可以直接点击播放这首诗的朗诵。

主要特点

  • 多媒体内容生成:能够一站式地输出文本(诗句)、音频(朗诵)、图片(背景图)和合成图(封面),实现了多种内容形态的协同创作。
  • 多 API 协同工作:工作流像一个总指挥,高效地调度了多个不同领域的第三方 API 服务(文案生成、语音合成、图像生成、图像渲染),共同完成一个复杂的创意任务。
  • 并行处理流程:音频和背景图的生成是同步进行的,有效缩短了整个作品的交付时间。
  • 动态图像合成:通过调用图像渲染服务,实现了将 AI 生成的文字和图片进行二次创作和动态排版,产出更具设计感的最终作品。
  • 完整的艺术体验:最终交付的不是零散的素材,而是一个集“可读、可视、可听”于一体的完整艺术体验。

非常适合用于社交媒体内容创作、个性化贺卡制作、诗词教学辅助以及任何希望以更丰富、更具感染力的方式来呈现文字内容的场景。

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容