微软azure的语音转文字STT功能部署详细步骤及避坑

语音转文本快速入门 - Azure AI services | Microsoft Learn

本文只讲基于python环境的部署,版本python==3.12

目录

一、使用需要注册账户

二、安装环境

三、speechsdk的使用 

四、服务器部署speechsdk 

 五、倘若是视频文件转换为wav


一、使用需要注册账户

这里使用就有一个条件了,可能很多人到这一步就结束了,因为这里需要这两种卡,但是我没有也没去找其他办法,我是叫我的一个朋友帮我注册好的:

注册好了之后会有如下这四个参数,我注册的区域是eastus,在调用时需要这些认证才可以正常使用,注意保护好自己的密钥。

 注册了会有一些免费额度,作为调试和自己平时使用没啥问题:

二、安装环境

最新受支持的 Visual C++ 可再发行程序包下载 | Microsoft Learn

首先要安装好c++的支持版本,找到自己对应的下载安装即可

设置好环境变量,可以在终端使用下代码:

setx SPEECH_KEY your-key
setx SPEECH_REGION your-region

但是我尝试了之后发现设置了之后还是没有用,我使用的是pycharm,可以直接在设置里面设置环境变量, 设置-工具-终端-环境变量,