为什么看不懂wav?
它告诉您文件的采样率(8000)而不是请求的(16000)错误。采样率对于语音识别软件非常重要。
为什么不能读取/ dev / dsp?
在最新版本的Ubuntu中,使用pulseaudio框架代替OSS。您尝试使用的版本正在使用OSS,因此您需要从发行版中安装oss-
compatibility软件包,以重新获得OSS支持。
您可以尝试支持PulseAudio的新版Julius
那么为什么它似乎能够读取/ dev / dsp却没有任何反应呢?
音频输入无法正常工作。
其他人在开源语音识别器上是否取得了成功,尤其是在Linux上?
我建议您重新使用CMUSphinx软件包,它是领先的开源语音识别引擎。网站上有大量文件,您只需要阅读它们即可。请记住,语音识别是一个复杂的领域,您可以在其中获得出色的成绩,但是您还需要花时间在理解技术上。就像其他任何域一样。
简而言之,要使用CMUSPhinx转录文件,您需要执行以下3个简单步骤:
提取wav文件,然后用sox将其重采样为8khz 16位单声道文件:
袜输入.wav -r 8000 -c 1重新采样.wav
安装pocketsphinx 0.7
apt-get install pocketsphinx
解码文件
pocketsphinx_continuous -samprate 8000 -infile resampled.wav
结果将打印到标准输出。要禁止记录器,请将stderr重定向添加到/ dev / null
pocketsphinx_continuous -infile resampled.wav 2> / dev / null



