首页系统综合问题能动嘴,咱就别动手-讯飞、百度、搜狗语音助手评测

能动嘴,咱就别动手-讯飞、百度、搜狗语音助手评测

时间2023-07-12 00:25:33发布分享专员分类系统综合问题浏览169

自从老罗在锤子手机发布会上进行演示,语音助手就从一个相对低调的小众领域,进入了公众的视野之中。随着识别技术的革新和产品的广泛应用,原本高大上的语音助手“黑科技”,也逐渐揭开了它神秘的面纱。

这一次,我们先简述介绍一下语音助手的产品概念,再对市面上几款主流的语音助手进行测试,看看它们究竟“黑”在了哪里?

一、语音助手究竟是什么?

语音助手,是一种最简单直观的语音控制程序。所有的科幻未来电影,都有人工智能与人类无障碍对话的场景。仅仅将人类的声音转换成文字,听起来并不复杂。一个单纯替代“人肉打字机”的功能,许多人干脆视之为鸡肋,对其不屑一顾。

不同于消费者的小心谨慎,科技市场对语音助手的竞争可谓狼烟四起空前火爆。除了国内的讯飞、百度、搜狗三大家之外,国外语音助手的技术开发更是激烈。Ios的Siri, Windows的小娜(Cortana),Android的Google now,无一不是在此领域投入了研发重金,每次都在新品发布会上大书特书。

那么,为什么语音助手这项功能,会受到如此多科技公司的青睐呢?

实际上,语音助手被唤醒、听明白、会说话的过程,背后对应的是机器学习(深度神经网络)和数据挖掘算法,以及语音识别、语义理解、语音合成技术,还需要语音知识数据库进行云端的大数据支持

二、语音输入是如何实现的?

从技术角度讲,语音的智能识别就是对声音这种波的信号处理。语音助手的理解过程,就是解码引擎在云端数据库里,以最快的速度来准确找到声音编码所对应的文字内容。通过含有特定唤醒词的语音输入,来唤醒语音识别系统,实现美妙的声音交互体验。

由于语音助手的技术难度大,投入时间周期长,所以在最初掀起一轮热潮后,绝大多数的中小型公司都逐渐退出了竞争的舞台,只留下科技行业的巨头们相互比拼着研发硬实力。从小词汇量、孤立词的识别到大词汇量、非特定人连续语音识别的飞跃,语音助手直到近几年才逐渐完善识别功能。

如今,多家语音助手都宣传自己的识别率能达到97%以上,接近人工智能的准入标准。相比起国际化的windows、ios、android三大家,中国本土的语音助手技术积累同样成熟。其中,尤以讯飞、百度、搜狗三家为首,在中文识别的领域更胜一筹。

——语音输入的效率,永远比不上键盘吗?

大兄弟,能动嘴的,咱们尽量还是别动手了。

三、语音识别测试

准确率和速度

语音识别是语音助手的基础,没有准确的识别能力,一切智能化的设想都将沦为空谈。

准确率和速度,始终是语音识别的首要标准,也关系着最直观的用户体验感。我们选择了同样的一段话,进行测试,看看这三家的语音识别表现如何。

讯飞的识别准确率很高,识别速度也很快,足以应付绝大多数的日常使用。

不过标点符号的处理略显粗糙,一路逗号下来的断句模式,肯定要让编辑们后期校对费上不少力气。

百度的文字识别准确率非常高。标点符号的处理和讯飞类似,结尾处的问号是加分项。

识别速度方面,百度的速度一般。但是,最多只有半秒左右的延时,差距并不明显,日常使用时基本可以忽略不计。

搜狗的语音识别准确率较好,标点符号的处理不过不失,还有一定的提升空间。搜狗的语音识别速度非常快,在测试中优于讯飞和百度,短句时表现尤为明显。

值得一提的是,搜狗的语音识别需要按住长按下方键位,在长期输入时会影响到用户的操作体验。

综合来说,三家的语音识别功能都很优秀,代表了市面上中文语音识别的高水准。但是,三款产品间的设计逻辑上存在着很明显的差异。

讯飞的文字识别是「整段识别」,当我们把整段话都说完后才会浮现出大片的文字。而搜狗和百度则是「实时识别」,当我们开始说话的时候,软件会逐字同步的将识别出的文字显示出来。

两者相比较的话,「整段识别」会有一定的情景化理解优势,便于理解特定场景里的文字含义。而「实时识别」便于用户在说话的同时,检查语音识别是否出现了错字漏字等情况,效率更高。在日常使用的场景里,百度搜狗的「实时识别」会方便高效一些,也贴近于我们平时使用键盘输入的操作习惯。而特定场景下的语音输入,讯飞的「整段识别」可能会更加出彩。

四、语音助手测试

智能服务,谁比谁更聪明?

上诉三个硬件指标,更多的是对语音识别技术的测试,考研的是软件本身把声音转换成本地文字的能力。而作为智能化的语音助手,除了基本的语音输入之外,更重要的是具有能理解情景和文本内容的能力

智能化的聊天与通讯服务的功能,是要检测一款语音助手够不够聪明,所考研的就是各家云端大数据的底蕴功底了

讯飞(灵犀)表现不错。不仅天气预报等常用的消息能做到及时反馈,生活中各种娱乐消费和地图搜索也都能识别并推送,满足了用户的日常需求。

作为搜索引擎的国产NO.1,百度语音助手的智能化表现略显不足。城市天气的查询没有问题,但是复杂的询问就一头雾水了,和ios的Siri倒是有点相似。

比起讯飞和百度,搜狗语音助手的表现非常出乎意料。不仅能满足日常的各种生活需求,还能打通搜狗地图与搜狗搜索等关联服务。

总的来说,在语音助手的智能化这一环节里,搜狗和讯飞的完成度更高。除了满足天气预报、收发快递、火车票、飞机票、通讯呼叫等生活需求外,它们还具备了听书、提醒、翻译、即搜即听等智能化的功能。而百度语音助手的基本功能足够,扩展性方面则有着一定的可提升空间。

五、语音助手的未来

目前的语音助手,还存在着许许多多的实际型问题。例如,当用户出现了口音过重、地方方言、环境嘈杂等特殊情况时,语音助手的识别能力会大大降低。单纯的查询和指令,在操作系统中过于单一,难于取代现有的键盘输入操作,最终沦为鸡肋摆设一样的花瓶玩具。理解场景和文本内容的能力有待加强,不同语境下不同词汇的辨别,是语音助手的一个大难题。

作为国内探索语音助手领域的先行者,讯飞、百度、搜狗三家企业的产品都初步解决了语音识别的问题,并在语音助手的生活化功能上具备了各自的优点与特色,但是,它们还无法在效率上形成绝对优势,难以在现阶段引起一场语音技术的科技革命,更多的是一种互补互助的关系。

不过,即便还有一些不够成熟,语音助手依然是人工智能技术在我们日常生活中最直接的应用方式。通过语音助手,人工智能系统可以听懂人类的需求,进行语义判断,然后迅速解析处理并在前台作出回应。进而不断自我学习,了解用户的说话方式和爱好需求,给予个性化反馈服务。

换言之,语音助手就是一切人工智能技术的基石,是整个闭环逻辑链条中的起点。通过高效准确的语音助手,我们才能拥有人工智能的无限可能。

爱资源吧版权声明:以上文中内容来自网络,如有侵权请联系删除,谢谢。

搜狗手机助手下载
路由器网关被重置导致网络无法连接的问题该如何解决? 路由器管理界面中外网访问选项的具体作用是什么?