原标题:走在输入法行业的前列,百度这几个"大招",斩获多个世界首次
众所周知,手机现在已经成为人们生活和工作无法「割舍」的工具,而手机里最无法「割舍」的工具是什么你们又知道吗?那就是「输入法」。作为现代人最主要的内容输出工具,输入法的使用早就已经突破了手指在键盘/屏幕敲击输出文字的局限,其中「语音输入」更成为时下最流行的输入方式,而百度输入法语音输入则是它们中的佼佼者。
(百度输入法)
其实在2019年初,百度输入法便宣布开启AI全感官输入2.0时代,将AI人工智能技术融合进入输入法当中,让用户在表达内容的时候更加方便易用,不仅可以大幅提高工作效率,更能够拉近人与人之间的距离。因为有了AI技术的加持,百度输入法的语音输入功能备受当下人们的喜爱。
百度除了将AI人工智能技术融合到输入法当中,还在2019年发布流式截断多层注意力建模(SMLTA),将在线语音相对准确率提升了15%,并且一举超越行业同类竞品,要知道语音输入如果准确率不高的话,那只能成为聊胜于无,而非实用好用的一项卖点。
(百度输入法-语音输入)
另外,对于一部分年龄较大的长辈们来说,输入法支持语音输入的确帮助很大,毕竟要他们重新学习如何使用手机输入法的键盘来打字并不是一件简单的事情,年轻的小伙伴们平常要上班,可以教父母使用手机的时间本来就不多,很容易会让家人之间的沟通产生问题,毕竟上班的时候不能时刻听语音,所以还是文字更靠谱,毕竟不会被噪声干扰而听不清。
有了语音输入后,长辈只需要对着手机说话就可以转换成相对应的文字,而且百度输入法的还支持多种方言的语音输入,比如说粤语、四川话、东北话等等,让部分上了年纪的用户不需要为普通话不标准而发愁,长辈们跟孩子们的交流也更加顺畅,还可以加深亲人之间的联系,让大家感情更加深厚。本人身处广州,测试了粤语的语音输入,识别率很高,常规的词汇和语句都能够完整准确识别出来。
(语音输入-粤语)
(粤语输入)
前文也说了,当代年轻人在工作和生活当中,一段超过30秒的语音可能会让对方倍感「烦躁」,所以有时候太长的语音还是适合以文字的形式发给对方,这个时候百度输入法的语音输入就派上用场了,用户只需要启动语音输入说出你想要说的话,百度输入法自动帮你转成文字,而且准确率非常高,确认之后就可以发送出去,不仅提高了效率而且让对方可以免遭长语音的「烦恼」。
虽然语音信息在不少社交软件可以用语音转文字来操作,但是很有可能会因为转译问题而造成信息误差,而百度输入法的语音输入准确的识别率可以让我们以文字的形式,将工作中的重要内容完整的展现给对方,毕竟语音输入转文字之后,你还可以检查确认一次,以免造成不必要的误会。
另外,百度输入法的语音输入还有其他很出色的体验。那就是你的聊天对象是来自于不同国家或地区的小伙伴,百度输入法语音输入还能够帮你化解语言不通的尴尬。语音输入功能可以将你的中文的语音直接翻译成英语、日语和韩语等文字,这样对方收到信息之后就能够马上清楚内容,让我们的工作效率大大提升,不再因语言不通「鸡同鸭讲眼碌碌」,而且这个功能也非常适合那些喜欢在世界各地旅游的小伙伴,有了百度输入法以后,就可以随时随地来一趟说走就走的旅行了。
(语音输入-中译英↑)
当然,日常使用输入法尤其是工作的时候,我们所处的环境不一定能够提供非常优质的网络信号,而大部分AI技术都需要依靠一定的网络支持,这种时候就非常考验各家输入法对于自家输入的「离线」优化能力了。上文我们也提到了百度输入法发布SMLTA,提升了语音输入的准确性,其实它同时还提升了离线语音识别的准确率,让它可以达到在线语音的水平。即使用处处于电梯、地铁、隧道等人流比较密集的离线环境中,依然能够精准识别出用户的语音。由此说明,在上述各种极度苛刻的环境下,百度输入法准确率依然还可以超过98%的语音输入服务。
(语音输入-离线语音↑)
百度输入法的离线语音功能设置方式为:在语音输入面板左上角,点击工具箱,即可进入设置离线功能,用户可以选择在无网络或网络不好时或者没有WiFi的时候开启即可。目前百度输入法的离线语音输入支持普通话和中英自由说,这里的中英自由说就是一段话当中同时出现中文和英文两种语言,而百度输入法可以将两种语言精确识别出来,并且通过语音输入将它们转换成文字。对于经常需要在手机上记录工作和学习资料,内容又包含中文和英文的小伙伴们来说,它会是你不可或缺的好帮手。
(离线中英自由说)
其实百度输入法的离线中英文语音识别系统,优势在于采用中英文混合建模技术,它将神经网络语言模型替换传统的N元语言模型,减少离线识别模型的体积。同时基于SMLTA的离线中英文语音识别系统还是首个基于Attention的端到端离线语音识别模型的产品部署,大幅提升离线中英文语音识别系统的性能。
(百度输入法)
总的来说,作为一家在输入法和AI人工智能上深耕多年的互联网公司,百度将两者非常完美的融合在一起,做出简单易用高效的百度输入法。而其中的语音输入功能更会备受用户喜爱,他们无论是工作还是生活,都离不开语音输入,因为它实在是太好用了。同时,前文提到的SMLTA技术更是世界上首次实现局部注意力建模识别精度可以超过全局注意力模型以及世界上第一次大规模部署在线语音交互注意力模型,这也意味着我们国家的中文在线语音识别技术的最高水平,走在世界的前列,扬威海外。