Dify 配置文字转语音

1. 配置 tts 模型

打开 “设置”,

在这里插入图片描述
选择 模型供应商,单击 “添加模型”,

在这里插入图片描述
输入各个项目的信息,单击 “保存”

  • 可用声音(用英文逗号分隔):en-US-AvaMultilingualNeural,en-US-AndrewMultilingualNeural,en-US-EmmaMultilingualNeural,en-US-BrianMultilingualNeural
    在这里插入图片描述
    在这里插入图片描述

本地部署 tts 可以参考 基于Edge-TTS的OpenAI兼容文本转语音API实战指南

2. 使用 tts

在调试与预览处单击 “管理”,
在这里插入图片描述
激活 “文字转语音”,

在这里插入图片描述
然后单击 “音色设置”,
在这里插入图片描述
根据情况设置合适的语言和音色,
在这里插入图片描述
这时单击 “播放” 图标,会报错 “TTS is not enabled”,
在这里插入图片描述
需要先单击 “发布更新”,

在这里插入图片描述
然后再单击 “播放” 图标,就可以了。
在这里插入图片描述
关于是否激活 “自动播放”,我使用 reasoning 模型时,只会生成部分 think 部分的内容,所以我这里保持关闭。
在这里插入图片描述

3. 测试一下

和AI聊天,之后就可以播放了。(这里是声音,文章中无法展示)
在这里插入图片描述
完结!

猜你喜欢

转载自blog.csdn.net/engchina/article/details/146848976
今日推荐