栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Java

使用百度tts合成音频融入Ekho方案

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

使用百度tts合成音频融入Ekho方案

使用商业TTS合成语音,再格式化,这样的录音没有爆破音、回音、底躁。

这里分享一个已经合成好的拼音集 baidu5003-sec-wav.tar.gz 百度网盘 请输入提取码,提取码:9f6f(下同),使用这个音调的拼音集可以跳过下述的 1~7 步直接执行第8、9步。如果要使用其他音调,需要执行 1~ 9步。

1、从 http://xh.5156edu.com 爬取拼音列表

        htmlshell.jar - 使用jsoup编写的java组件包,见 htmlshell.jar(百度网盘 请输入提取码)

#!/bin/bash
​
pinyinfile=pinyin.txt
pinyinbase=http://xh.5156edu.com
pinyinurl=$pinyinbase/pinyi.html
​
pinyin=`java -jar htmlshell.jar $pinyinurl fontbox html out | awk -F '"' '{print "'"$pinyinbase/"'"$4}'`
​
echo -en > $pinyinfile
for url in $pinyin;
do
        java -jar htmlshell.jar $url font_14 text | grep -v "未分类" >> $pinyinfile
done

爬取下来的拼音有1317个,其中有两组重复出现的拼音,即有效拼音为 1315 个。爬取的结果如下:

ā
á
ǎ
à
āi
ái
ǎi
ài
ān
án

2、脱敏某些拼音,并在每行上加上句号“。”,即:

  1. bi 的拼音会识别为“敏感”音

    bī
    bí
    bǐ
    bì
    # 把上面的拼音脱敏成以下内容
    偪。
    比。
    笔。
    闭。
  1. shun 的拼音会识别为“敏感”音

    shūn
    shǔn
    shùn
    # 把上面的拼音脱敏成以下内容
    楯。
    吮。
    顺。
  2. “nun。o。” 的发出错,发成连音,不就方便语音切割

    # 这样的组合会使百度发音出错,出现连音
    nún。
    ō。
    # 改为即可
    黁。
    ō。

3、使用https://ai.baidu.com/tech/speech/tts_online百度在线免费语音合成,每次最多可以合成200个UTF-8字符。

百度付费版 tts 支持直接返回二进制音频数据,百度在线免费版返回的是音频的 base64 编码数据。

使用百度在线免费试用版时,使用curl 命令如下:

curl 'https://ai.baidu.com/aidemo' 
  -H 'Connection: keep-alive' 
  -H 'sec-ch-ua: " Not A;Brand";v="99", "Chromium";v="98", "Google Chrome";v="98"' 
  -H 'sec-ch-ua-mobile: ?0' 
  -H 'User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36' 
  -H 'sec-ch-ua-platform: "Windows"' 
  -H 'Content-Type: application/x-www-form-urlencoded' 
  -H 'Accept: *}
    ffmpeg -i $file -f wav secs-wave/${name%%.*}.wav
done
​
tar -czvf baidu-secs-wave.tar.gz secs-wave

8、将第7步生成的子片段 wav 文件集移入 ekho 的 ekho-data 目录下

cd ekho/ekho-data
​
# 将 baidu-secs-wave.tar.gz 拷贝到当前目录下,然后解压
tar -xvf baidu-secs-wave.tar.gz
# 创建软链接
ln -s secs-wave pinyin
​
# 拷贝生成 de5.wav
cp pinyin/de1.wav pinyin/de5.wav -rf

9、删除 ekho-data 目录下的 pinyin.index、pinyin.voice文件,然后使用命令测试并初始化 ekho 组件。(可以参考:如何为Ekho添加新的声音)

cd ekho/ekho-data
rm -rf pinyin.*
​
cd ..
# 测试并初始化
./bin/ekho 0123456789 -vpinyin -o test.ogg -t ogg

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/845701.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号