Dify 配置文字转语音
1. 配置 tts 模型
打开 “设置”,
选择 模型供应商,单击 “添加模型”,
输入各个项目的信息,单击 “保存”
- 可用声音(用英文逗号分隔):
en-US-AvaMultilingualNeural,en-US-AndrewMultilingualNeural,en-US-EmmaMultilingualNeural,en-US-BrianMultilingualNeural
本地部署 tts 可以参考 基于Edge-TTS的OpenAI兼容文本转语音API实战指南
2. 使用 tts
在调试与预览处单击 “管理”,
激活 “文字转语音”,
然后单击 “音色设置”,
根据情况设置合适的语言和音色,
这时单击 “播放” 图标,会报错 “TTS is not enabled”,
需要先单击 “发布更新”,
然后再单击 “播放” 图标,就可以了。
关于是否激活 “自动播放”,我使用 reasoning 模型时,只会生成部分 think 部分的内容,所以我这里保持关闭。
3. 测试一下
和AI聊天,之后就可以播放了。(这里是声音,文章中无法展示)
完结!