« | September 2025 | » | 日 | 一 | 二 | 三 | 四 | 五 | 六 | | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | | | | | |
| 公告 |
暂无公告... |
Blog信息 |
blog名称:技术以人为本 日志总数:7 评论数量:28 留言数量:0 访问次数:92680 建立时间:2005年8月8日 |

| |
[技术未来]语音识别初探(1) 原创空间, 软件技术, 科学研究
eng2chi 发表于 2005/8/16 15:24:32 |
语音识别(speech recognition)行之有年, 但进展缓慢. BILL GATES 预测
speech recognition will go mainstream in three to four years
, 但明显挑战大过机会,这点他自己也有清醒的认识:
Even the elusive promise of speech recognition will be realized in three to four years, Gates said. He noted that in an artificial environment, the computer already comes close to humans in recognizing speech. What it does not quite have -- yet -- is the human ability to distinguish background noise from significant signals. But, pointing to the reduction in error rates, Gates predicted that the problems facing speech recognition will be solved in this decade.
在虚假人工的环境里的声音辨识,计算机已经接近和人媲美的程度(这点仍值得怀疑,至少得考察一下微软在声音识别上最新的进展才行). 而在有噪音的真实环境里的声音识别,还远未能及人的能力.
鉴于BILL通常对于未来过于乐观,我想无论是3到4年里明显的技术进步,还是十年内真实环境声音识别的突破,都要打个折扣.
话虽如此, 许多大的公司,研究团体对语音识别的努力是有目共睹,取得的贡献也多少值得欢欣. 作为语音识别相辅相成一面的TEXT TO SPEECH(文本朗读), 如今就多少接近一般人的低级水平.
下一节, 探讨一下微软的Speech SDK 5.1 ,根据实用的结果, 辨识结果的确令人啼笑皆非. 原来以为,低一点的识别率无关紧要, 能够应用到海量的语音信息的检索也能功不可没,但如此低的识别, 还是有点令人失望. 当然,这也证实了需要训练集和一些学习算法的重要性,因为目前测试到的差结果是没有经过训练和迭代优化和加强的. |
|
|