iOS 7预计在9月10日发布,这令众多果粉欢喜万分,ios7在界面上做了重大革新,这也是让众多媒体报道和关注的地方,不过ios其实还有很多功能方面的变化,比如:Siri就获得了大量更新和完善,或许在苹果移动操作系统的所有原生应用中,Siri在这次iOS 7更新中获得更新幅度是最大。在iOS 7中,Siri的用户界面经过全新设计,获得了新的声音和新的功能。在iOS 7中,Siri的界面以渐入的方式显示,而且会出现在用户屏幕上方。与上一个版本相比,它会以更加清晰更加自然的声音来和你进行对话。它回答问题的速度也更快了,能够从不同的来源为用户搜寻答案,给用户提供他们最想看到的答案。这些来源包括Bing、Wikipedia以及Twitter。Siri还可以帮助用户完成更多任务,比如播放语音邮件、控制iTunesRadio甚至回拨电话等。以这样的发展速度,难保在iOS8中Siri不会成为用户真正的“代理人”。 有消息称iOS7系统中Siri将会更加智能,当识别错误的时候你只需要简单的说:“联系人”的名字并不是这样发音的。” Siri就会自动开启学习进程。回想下,苹果首次推出Siri之后大部分的消费者都反馈称名字的发音不准确,所以导致在实际使用过程中用户需要为每个联系人手动发音拼写以便让Siri正确识别,但这种扼杀用户使用积极性的局面在iOS7系统中将会得到改变。

  目前在世界上,Goolge Now 和 siri虽然是主流语音识别技术,但是主要针对的是英语用户,对于汉语来说,他们的技术还是让广大的小伙伴们“捉急的” 。

  看过了国外的语音行业的“产品Show”,让我们来看看国内语音行业比较有特点的公司近期的一些表现,最具代表性的莫过于科大讯飞和云知声了。既然是语音识别行业,那我们就从语音技术中文语音识别角度做一个测试:

  我们拿一段经典绕口令来测试,siri是无能为力的,僵在识别界面沉思不语,然后我们对科大讯飞和云知声分别做了实验:见下图

  两者之间有些差异,主要在鳎目和塔嘛,查了一下其实这两个都对,科大讯飞更学术一些,而云知声则更民俗一些。不过这个测试也充分说明了国内的语音行业公司在中文语音识别方面做的还是比国外公司要专业很多。

  同时,国内语音公司的优势还体现在他们的app上。科大讯飞出了好几款app,但是在目前用户最大的app之一微信上,则没有针对性的插件,在发消息的那栏才会有微信的图标,而云知声显得更加接地气,为微信单独做了一款插件,在发信息栏可以直接插入语音输入。在最近出来挑战微信的易信上,让我们看到了云知声的身影,他们提供的语音助手服务,无论从界面设计还是从产品使用上面更显流畅、灵活,而科大讯飞则完全无视,显得更加气粗一些。

  由于在手机上还没有特别成熟的商业模式,作为上市公司科大讯飞的战略以政府和运营商合作,跟政府合作可以获取政府政策和资金的支持;而跟运营商合作,则除了卖技术给运营商获得大笔收入,还可通过获得用户的语音资源,来提高识别率;此外跟教育和玩具行业合作,则是科大讯飞的另一个收入来源。总的来说,科大讯飞做的是泛语音商业模式。

  相对于背景深厚的科大讯飞,云知声的战略看起来似乎更加贴近移动互联网,更接近于siri的模式,云知声对移动互联网的开发者更加友好一些,对于开发者无论大小,都能认真高效地对待提供技术支持和答疑,而科大讯飞的答复则更加官方。

  在产品方面,科大讯飞和云知声都进入了教育、智能电视、可穿戴设备,科大讯飞由于先发优势,在产品的种类上更加丰富,而云知声的技术优势也很多:

  1. 语音唤醒,语音监听技术,通过特定语音指令即可开启语音指令接收,无需人手操作,在物联网中非常实用。

  2. 离线限定范围识别技术(比如语控精灵的语音人名呼叫,通过语音设置设备,APP开关操作),毫秒级的响应速度,95%以上的正确率;Siri现在没有,iOS7 可能会有。

  3. 在线识别率超过94%,几乎接近人类听写能力,而且超高的流量节省技术在任何网络环境下都可以完美体现云知声的语音识别能力。

  4. 真实自然的声音实现的文字播报能力,真正成为智能秘书。

  5. 上下文的语义解析能力,实现全程语音操控;(Siri做到的极少)。

  6. 中国本地化的服务非常全面和地道,已经超越Siri。

  通过以上罗列的种种,我们是不是可以自豪的说,无论是科大讯飞还是云知声,再或者是百度或者腾讯,在语音识别领域已经适时的抓住了机遇并随时接受行业的各种挑战。IOS7的到来,对于国内的“siri们”是否是个巨大的挑战呢?亦有可能是开辟了更大的应用市场和机会。我们相信只要坚持本地化,无论科大讯飞还是云知声,都会有不错的前景,对于中国的用户和开发者,都有更多地选择。