织梦CMS - 轻松建站从此开始!

罗索实验室

当前位置: 主页 > 行业动态 > 『生物识别』 >

小探移动设备上的语音识别

落鹤生 发布于 2014-12-29 13:24 点击:次 
最近移动平台上有关语音识别的应用非常火爆,国外有siri和google voice search,国内有像挖财和UC浏览器等推出的语音输入和控制功能。今天也小试了吧,感觉这类技术已到了大规模应用的阶段。
TAG: 语音识别  

最近移动平台上有关语音识别的应用非常火爆,国外有siri和google voice search,国内有像挖财和UC浏览器等推出的语音输入和控制功能。今天也小试了吧,感觉这类技术已到了大规模应用的阶段。

以前的手机上也有类似语音控制的功能,记得最早使用的Nokia 6630就有一个专门语音指令输入的按钮,但这类应用非常简单,只能是有限的指令匹配。而现在,由于云的加入,使得语音识别非常的准确,有让人吃惊的效 果,不信的人可以试试挖财上的语音识别。所以现在的语音识别的应用基本上都是在远端的云里完成,移动设备仅仅只是完成语音数据的采集和发送的功能。

于是乎,我就对挖财这类应用是如何做到这么高的识别率产生兴趣,这才发现,它是基于讯飞(http://www.voicecloud.cn)来完 成语音识别的,它基于讯飞提供的API,把语音数据发过去,讯飞把识别后的文字返回。既然如此,我们也能基于讯飞做一些有关语音识别的应用的。正好讯飞就 是这种提供接口的平台类公司,对开发者的支持还不错,下午花了不到一个小时时间既然可以在手机上搞出一个不错的语音识别应用。

1)申请开发者帐号

在http://dev.voicecloud.cn/上申请一个开发者帐号,它会给你一个APP ID,这个审批过程很快,不到10分钟

2)下载SDK

http://dev.voicecloud.cn/download.php?vt=1

我下载的是android SDK

3)编译和调试demo

在下载下来的SDK有个sample目录,下面有个MSCDemo的应用,直接把它导入到eclipse里

编译时有错,把有错那行删除即可。

由于还没解决在android模拟器里无法语音输入的问题,我只好在真机上调试。

4)运行demo

简单试用后,发现效果确实不错。

语音输入提示:

对句子的识别:

对一些不良用语的转义(我说“他妈的”):

蛮有意思的,可见讯飞后台有个很强大的语料库,具备一定的人工智能能力。

不过,还没找到讯飞是如何收费的信息,如果要商用的话,得好好考察一下。以后有时间,可以研究一下这个语音识别的云端是如何实现的,争取能自己搭建一个小型的云服务。

(cutesource)
本站文章除注明转载外,均为本站原创或编译欢迎任何形式的转载,但请务必注明出处,尊重他人劳动,同学习共成长。转载请注明:文章转载自:罗索实验室 [http://www1.rosoo.net/a/201412/17176.html]
本文出处:CSDN博客 作者:cutesource 原文
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片