百度语音使用

 一、注册百度云账号然后选择百度语音功能

百度语音使用

二、创建百度语音的应用:

百度语音使用

 全部选择默认或者针对选择你所需要的功能就可以了

然后查看你所创建的内容:

百度语音使用

 根据左侧的技术文档然后进行查看

百度语音使用

选择百度语音中python的语音识别

百度语音使用

然后点击

百度语音使用

然后根据你的功能需求 选择语音识别或者合成

语音识别的只能识别pcm的格式一半windows和mac录音的文件都需要进行转码  所以我们要用ffemp软件进行转码 

上面的百度语音的处理要导入百度语音的包

百度语音使用

然后下面是代码测试

百度语音测试:

from aip import AipSpeech  #导入 百度语音包
from aip import AipNlp  # 导入字然语言识别
import tuling   # 导入图灵
import os

""" 百度智能语音的使用 """
# 如果是需要期对应的功能你的百度语音就需要打开对应的功能
APP_ID = '11799980'
API_KEY = '6WIC3XSGPt5lTEnBgbDZy43T'
SECRET_KEY = 'vtck1Sbho2HC5NMGs6Ir2glQmWPjhj8u'



client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
nlp_client = AipNlp(APP_ID, API_KEY, SECRET_KEY)


# ====输入汉字输出语音=====


result  = client.synthesis('人人为己,己为人人', 'zh', 1, {
    'pid':9,
    'per':'1',
    'vol': 5,
})

# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
    with open('auido.mp3', 'wb') as f:
        f.write(result)


# =====语音转化为汉字======


# 读取文件
filepath = "录音.m4a"  #获取你的语音文件

def get_file_content(filePath):
    os.system(f"ffmpeg -y -i {filePath}  -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {filePath}.pcm")  #修改你的文件的名字
    with open(f"{filepath}.pcm", 'rb') as fp:
        return fp.read()



# 识别本地文件
liu = get_file_content(filepath)
res = client.asr(liu, 'pcm', 16000, {
    'dev_pid': 1536,
})
# print(res)
if res.get("result"):
    print(res.get("result"))
else:
    print(res)
百度语音处理
#zh 是中文 1是代表声音是谁发的具体看文档

以上是对你的语音和文字的测试

下面可以对你的语音或者文字是否相似来进行判断

相似度:

选择相似度的时候你要选择你所对应的类型,选择处理哪种类型

百度语音使用

 

然后再选择字然语言处理的sdk文档

百度语音使用

然后导入对应的处理的包:

百度语音使用

自然语言处理  此处用的是短文本的处理 用来判断你的输入的文本是否相同

from aip import AipNlp  #导入字然语言要处理的包

""" 你的 APPID AK SK """
APP_ID = '11799980'
API_KEY = '6WIC3XSGPt5lTEnBgbDZy43T'
SECRET_KEY = 'vtck1Sbho2HC5NMGs6Ir2glQmWPjhj8u'

nlp_client = AipNlp(APP_ID, API_KEY, SECRET_KEY)

res = nlp_client.simnet("你叫什么","我也不知道")  #进行相识度判断  如果都差不多
# print(res)

if res.get("score") > 0.7:  # 如果差不多的相同达到0.7
    print("你叫什么")

else:  #相识度不满足
    print("说的我也不知道")