当前位置: 主页 > 行业动态 >

正确理解李开复所说科大讯飞不懂语音,99%的语音识别要死掉

时间:2018-07-29 21:55来源:本站 作者:秩名 点击:
为什么李开复说科大讯飞不懂语音,99%的语音识别项目要死掉?

  一直以来,许多语音公司都在吹捧:“我们的语音识别率已经达到95%以上”。然而,市面上语音交互产品的体验仍然是弱爆了,到了真实语音交互场景下,复杂的声场环境,各种噪音的影响,语音识别率直线下降,很多产品的语音交互功能都直接歇菜,所以才有李开复大会报告“科大不懂语言,99%的语音识别真的要死掉”的结论。

正确理解李开复所说科大讯飞不懂语音,99%的语音识别要死掉

  其实,大家所提到高识别率,还停留在“近场语音识别”的阶段,即必须是低噪声、无混响、距离声源很近的场景,但是,若声源距离距离较远,并且真实环境存在大量的噪声、多径反射和混响,导致拾取信号的质量下降,这就会严重影响语音识别率。通常近场语音识别引擎在远场环境下,若没有声学处理的支持,比如麦克风阵列技术的适配,其真实场景识别率实际不足60%。

  所以把噪音问题解决好,就可以提高识别率,但是语音仅仅是识别率的问题吗?李开复的报告中提到,现在的语音识别仍然是停留在Speech-to-text,而非语音理解Speech-to-meaning,正如李开复老师所说:“其实,我听懂讲的每个字不代表听懂了意思,甚至把英文翻译成中文,中文翻译成英文还是没有搞懂。你们不要看科大迅飞的演讲说懂得语音了,其实他一点不懂,他只能把音变成字,字变成音。你问他讲什么,一个字不懂。所以,语音识别还是要做的更好。”

  这也是为什么李开复说科大其实不懂语音,当然本意不是完全否定科大的语音技术,只是告诫现在语音识别技术还有很长的一段路要走。目前“语音识别是所有技术里面最不成熟的”的原因有两点:一是涉及声学处理的软硬件还没有标准化,可以理解成机器的耳朵还不够好;二是自然语言处理还没有到达突破点,事实上机器根本不懂人类语言。

  此外,李开复老师提出的99%语音识别项目会死掉也有一定的参考,因为语音识别本质上就要和声学处理融合,没有好的耳朵显然是不行的,显然计算机学科无法绕过物理学科的壁垒。

------分隔线----------------------------
相关文章