语音对话机器人搭建

其他 2021-04-05 00:32:15 阅读次数: 0

基于百度AI和图灵机器人搭建的语音对话机器人

源码：


from aip import AipSpeech
import requests
import json
import speech_recognition as sr
import win32com.client

# 初始化语音
speaker = win32com.client.Dispatch("SAPI.SpVoice")


# 1、语音生成音频文件,录音并以当前时间戳保存到voices文件中
# Use SpeechRecognition to record 使用语音识别录制
def my_record(rate=16000):
    r = sr.Recognizer()
    with sr.Microphone(sample_rate=rate) as source:
        print("please say something")
        audio = r.listen(source)

    with open("voices/myvoices.wav", "wb") as f:
        f.write(audio.get_wav_data())


# 2、音频文件转文字：采用百度的语音识别python-SDK
# 导入我们需要的模块名，然后将音频文件发送给出去，返回文字。
# 百度语音识别API配置参数
APP_ID = '******'
API_KEY = '********'
SECRET_KEY = '************'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
path = 'voices/myvoices.wav'


# 将语音转文本STT
def listen():
    # 读取录音文件
    with open(path, 'rb') as fp:
        voices = fp.read()
    try:
        # 参数dev_pid：1536普通话(支持简单的英文识别)、1537普通话(纯中文识别)、1737英语、1637粤语、1837四川话、1936普通话远场
        result = client.asr(voices, 'wav', 16000, {
    
    'dev_pid': 1537, })
        # result = CLIENT.asr(get_file_content(path), 'wav', 16000, {'lan': 'zh', })
        #print(result)
        #print(result['result'][0])
        #print(result)
        result_text = result["result"][0]
        print("you said: " + result_text)
        return result_text
    except KeyError:
        print("KeyError")
        speaker.Speak("你说啥？？？风太大我听不见！！！")


# 3、与机器人对话：调用的是图灵机器人
# 图灵机器人的API_KEY、API_URL
turing_api_key = "********"
api_url = "http://openapi.tuling123.com/openapi/api/v2"  # 图灵机器人api网址
headers = {
    
    'Content-Type': 'application/json;charset=UTF-8'}


# 图灵机器人回复
def Turing(text_words=""):
    req = {
    
    
        "reqType": 0,
        "perception": {
    
    
            "inputText": {
    
    
                "text": text_words
            },

            "selfInfo": {
    
    
                "location": {
    
    
                    "city": "天津",
                    "province": "天津",
                    "street": "蓟县"
                }
            }
        },
        "userInfo": {
    
    
            "apiKey": turing_api_key,  # 你的图灵机器人apiKey
            "userId": "Tuesday"  # 用户唯一标识(随便填, 非密钥)
        }
    }

    req["perception"]["inputText"]["text"] = text_words
    response = requests.request("post", api_url, json=req, headers=headers)
    response_dict = json.loads(response.text)

    result = response_dict["results"][0]["values"]["text"]
    print("AI Robot said: " + result)
    return result


# 语音合成，输出机器人的回答
while True:
    my_record()
    request = listen()
    response = Turing(request)
    speaker.Speak(response)

大体思路就是通过百度API把音频转化为文字，然后通过图灵机器人得到回复，TTS将文本转成音频播放出来。

做完觉得其实以前觉得很厉害的东西其实也没有那么难搞，不过就是~~掉几根头发~~熬几个晚上而已。

大头是下包包，搞了好久，在这里谢谢我的好兄弟张玥熙，帮我解决了很大的难题，我祝她想吃鸡就吃鸡，上王者轻而易举，斗地主3456必有7。

总的来说这次没什么参与感，仅仅就是下了几个库调了几个接口而已，不过还是很开心啦，毕竟是第一次做出自己的机器人嘤嘤嘤。

最后是我与鸡肋机器人对话的视频，看一乐儿得了

《我与大鹅》标题有点短，详细的标题更容易吸引用户增加曝光

猜你喜欢

转载自blog.csdn.net/m0_46330606/article/details/112261104

语音对话机器人搭建

Python3从零开始搭建一个语音对话机器人

搭建一个属于自己的语音对话机器人

基于树莓派的语音对话机器人

中文语音对话机器人/智能音箱项目

树莓派制作语音对话机器人

对话机器人---智能客服

对话机器人综述

语音对话机器人，百行Python代码就能轻松实现

最佳实践 | 用腾讯云智能语音打造智能对话机器人

快速搭建对话机器人，就用这一招！

搭建一个AI对话机器人——前端ChatUI使用纪录

对话机器人技术简介：问答系统、对话系统与聊天机器人

揭秘任务型对话机器人（下篇）

揭秘任务型对话机器人（上篇）

回顾·智能导购对话机器人实践

揭秘任务型对话机器人(转)

python2 自动对话机器人代码

深度学习应用--对话机器人--简介

Python智能对话机器人实现

[小白系列]基于Syntax Tree的对话机器人

对话机器人，电商客服的救星

爬虫+基本的天气对话机器人

NLP+对话机器人技术峰会

ChatGPT不止是对话机器人

rasa开发多轮对话机器人进阶

大模型之十九-对话机器人

基于树莓派的对话机器人

【对话机器人】开源机器人项目介绍

AI电销机器人系统开发搭建AI智能语音系统|电话机器人电销源码|电销外呼系统

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)