本站首页    管理页面    写新日志    退出


«September 2025»
123456
78910111213
14151617181920
21222324252627
282930


公告
暂无公告...

我的分类(专题)

日志更新

最新评论

留言板

链接


Blog信息
blog名称:技术以人为本
日志总数:7
评论数量:28
留言数量:0
访问次数:92680
建立时间:2005年8月8日




[技术未来]语音识别初探(1)
原创空间,  软件技术,  科学研究

eng2chi 发表于 2005/8/16 15:24:32

 语音识别(speech recognition)行之有年, 但进展缓慢. BILL GATES 预测 speech recognition will go mainstream in three to four years , 但明显挑战大过机会,这点他自己也有清醒的认识: Even the elusive promise of speech recognition will be realized in three to four years, Gates said. He noted that in an artificial environment, the computer already comes close to humans in recognizing speech. What it does not quite have -- yet -- is the human ability to distinguish background noise from significant signals. But, pointing to the reduction in error rates, Gates predicted that the problems facing speech recognition will be solved in this decade. 在虚假人工的环境里的声音辨识,计算机已经接近和人媲美的程度(这点仍值得怀疑,至少得考察一下微软在声音识别上最新的进展才行). 而在有噪音的真实环境里的声音识别,还远未能及人的能力. 鉴于BILL通常对于未来过于乐观,我想无论是3到4年里明显的技术进步,还是十年内真实环境声音识别的突破,都要打个折扣. 话虽如此, 许多大的公司,研究团体对语音识别的努力是有目共睹,取得的贡献也多少值得欢欣. 作为语音识别相辅相成一面的TEXT TO SPEECH(文本朗读), 如今就多少接近一般人的低级水平. 下一节, 探讨一下微软的Speech SDK 5.1 ,根据实用的结果, 辨识结果的确令人啼笑皆非. 原来以为,低一点的识别率无关紧要, 能够应用到海量的语音信息的检索也能功不可没,但如此低的识别, 还是有点令人失望. 当然,这也证实了需要训练集和一些学习算法的重要性,因为目前测试到的差结果是没有经过训练和迭代优化和加强的.


阅读全文(3365) | 回复(0) | 编辑 | 精华
 



发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)



站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.032 second(s), page refreshed 144808924 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号