栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

NEMO中文语音识别ASR资源 : DEMO/API/pretrained

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

NEMO中文语音识别ASR资源 : DEMO/API/pretrained

一、说明

英伟达的ASR项目的开源版本NEMO。

NeMo非常强大,覆盖了ASR, NLP, TTS,提供了预训练模型及完整的训练模块。其商业版本为RIVA。

开源代码: https://github.com/NVIDIA/NeMo

二、资源入口
效果演示、API接口示例、下载资源,集中于微信小程序:小鹰微智
【不要求注册,不获取个人信息】

三、API调用

python示例:

import requests
password='1869'
url = "http://www.iinside.cn:7001/api_req"
filePath='C:/Users/文/Music/record/me/20210820_006.wav'
data={
    'password':password,
    'reqmode':'asr_nemo_ch1'
}
files=[
  ('sound_asr_nemo_ch1',('20210820_006.wav',open(filePath,'rb'),'audio/wav'))
]
headers = {}
response = requests.post( url, headers=headers, data=data, files=files)
print(response.text)

1,password: 公众号【智会无界】回复关键字:asr_nemo_ch1 获取【需先关注】

2,回应示例:

{
“code”: 0,
“data”: “这个还是比较有趣的”
}
如果code为-1,data是错误提示

3,可以用Postman进行测试,注意语音文件的KEY为“sound_asr_nemo_ch1”

四、本地部署

预训练模型可在小程序 小鹰微智中获取链接。
网度网盘提取码:公众号【智会无界】回复关键字:asr_nemo_ch1 获取
API提供的是POST模式, NeMo还支持流式缓冲,实时解码:https://github.com/NVIDIA/NeMo/tree/main/examples/asr/asr_chunked_inference

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/822693.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号