« | September 2025 | » | 日 | 一 | 二 | 三 | 四 | 五 | 六 | | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | | | | | |
| 公告 |
暂无公告... |
Blog信息 |
blog名称:技术以人为本 日志总数:7 评论数量:28 留言数量:0 访问次数:92645 建立时间:2005年8月8日 |

| |
[技术未来]语音识别初探(2) 原创空间, 软件技术, 科学研究
eng2chi 发表于 2005/8/16 16:05:24 |
Microsoft® Speech SDK 5.1 是微软比较为人所知的语音处理包, 支持TTS和语音识别(SPEECH RECOGNITION). 为了能支持中文, 还必须下载5.1 Language Pack. [不知微软的Microsoft Speech Server (MSS) 2004 R2 和Microsoft Speech Application SDK (SASDK) Version 1.1 有何独特之处, 似乎胜过SDK 5.1]
下载安装SDK 5.1之后,在 本地 Microsoft Speech SDK 5.1\Samples 的目录可以找到些例子, 用C#, VB, DHTML等写成, 有些很别致有趣. 比如SCRIPTS 里面的DHTML用网页的形式提供TTS功能.
测试了一下VB目录下RecoVB的程序, 它主要用来展示识别的功能. 因为没有话筒, 参照 Using Wave File Input with the Speech Recognition Engines 修改成WAV文件的输入, 从网络和一些电台录了些短小句子进行测试, 结果不甚理想:
原句(语速慢简单): 我是陈小英
识别:和吸引全一起熬一
原句(语速快,电台节目音): 获胜, 所以说短线日元走势还相对平稳,我个人认为后期可能日元比美元还将保持这种上行的空间
识别:奥胜队的损害人口是很难得很牢了日元对美元和良好的安全利益
原句(较难): They agreed that the one he who first succeeded in making the traveller take his clothes off should be considered stronger than any other
识别:They agreed that that when he first succeeded in making a talented cast club got to be considered found at Bundy and
总体看来, 英文识别还是有一定水平,难怪BILL敢说三到四年会有明显进步,估计是针对英文识别说的. 而中文就挑战大得多, 初步来看,只是有个别字词可以听出来.
|
|
回复:语音识别初探(2) 原创空间, 软件技术, 科学研究
老土人(游客)发表评论于2007/6/29 17:05:49 |
我想要一份,供学习之用,希望大家共同研究这样的问题,我的邮箱是:ahnz@sohu.com |
|
回复:语音识别初探(2) 原创空间, 软件技术, 科学研究
pydeng(游客)发表评论于2007/4/24 12:49:33 |
你好,我正在用Speech SDK完成一份作业,我在一个按钮点击事件中载入WAV文件作为SR引擎的输入,我希望每次点击该按钮都重新载入WAV文件,然后对它进行识别,结果SR引擎只识别了第一个载入的文件,返回了一个识别消息,第二个及后面载入的文件都得不到识别,请问你知道怎么解决这个问题吗?谢谢!我的EMAIL:pydeng@gmail.com |
|
回复:语音识别初探(2) 原创空间, 软件技术, 科学研究
游客(游客)发表评论于2006/7/6 9:33:57 |
能给一个识别语音输入的简单的c++源程序吗?不胜感激!!! |
|
回复:语音识别初探(2) 原创空间, 软件技术, 科学研究
fleer(游客)发表评论于2006/6/4 8:04:47 |
可以发给我一份你写的程序么?hfleer@sina.com |
|
» 1 »
|