新文化网 > 财经 >华为EMUI语音助手长大了,可识别主人声音,背后技术揭秘

华为EMUI语音助手长大了,可识别主人声音,背后技术揭秘

2020-03-30 11:08:19 来源:互联网 阅读:-

华为EMUI的小艺长大了——看下图,猜一猜这一次小艺又进化了什么能力?

天啦,语音操作下,你想插嘴打断就打断了?嘈杂环境下,怎么不被噪声干扰?

华为EMUI语音助手长大了,升级EMUI10后的智能语音多了这个功能,可识别主人声音,瞬间让智能语音好用很多。长按电源键1秒唤醒小艺:惊不惊喜,意不意外!这么“skr”的能力,让我们细细说来。

过滤掉噪声,扫除基础障碍

实现插嘴打断的第一步,是让小艺在嘈杂环境下,清楚地识别出人声。声音本质是携带信息的能量波,为了把你的声音从茫茫的噪声海中pick出来,小艺通过音频降噪和语音识别降噪,共同抑制噪声能量、增强人声能量。

如果说在嘈杂的背景声中选出人声属于众里寻他千百度,那旁边有人在大声说话、能量波强度也相似的干扰场景就属于真假美猴王了。对于这个问题,小艺使用华为特有的VAD和ASR识别机制来解决。

普通的VAD技术可以识别出噪声和人声。而华为特有的VAD结合ASR识别机制,可以区分出噪声、无效人声、有效人声。做到噪音和无效人声不识别,当前有效人声才能识别。

消除播报的回音,清扫第二只拦路虎

既然能在嘈杂环境下识别出你的声音,那随时打断小艺,也就是小意思了。但插嘴打断是在播报时候进行的,那就不可避免的会把手机语音播报的内容给收进去。理想的方案是回声消除法:即用原始音消除播报回声的能量。

现实中,因为器件和声音外放的原因,声音的波形会发生变化,实际的回声声波和原始声波不能成线性,说人话就是不能消除。

这就轮到华为独特的AI消噪技术上场了。它引入深度神经网络来训练智能的语音识别声学模型,消除变形的能量。

不是对我说的话,我绝不会误解

过滤掉这两种干扰后,当你在小艺播报过程中打断它时,它都能准确识别出你的声音、理解你的意图,并做出回应。或许你还有一个疑问:小艺播报时我跟旁人的对话,岂不是也会打断小艺?

不会的。小艺引入了强大的意图分类模型,通过把文字识别成意图,可以分辨出你是否在对它讲话,从而避免被干扰。

经历了九九八十一难,你的语音在各种干扰的情况下,经历了语音转换和语义识别,实现了嘈杂环境、人声干扰、播报回声干扰中的识别,最终成功插嘴打断。

成人的世界没有一件事是容易的。

不过再难,小艺也会与你一路同行,共同成长。

这么好用的语音助手黑科技哪里有呢?在装有EMUI10的全新Mate30系列手机上,快快体验一下吧!

欢迎关注 [ 华为手机功能教程] ,人人都做手机达人。

推荐阅读:苹果x和xr那个好

(正文已结束)

热点图片 更多>>
比《庆余年》更好看的穿越剧,19年前就拍好了!无法超越的经典 比《庆余年》更好看的穿
枕上书:司命、连宋剧中采用原班人马,是刻意为之还是难言之隐? 枕上书:司命、连宋剧中
《锦衣之下》要拍续集?剧二代扑街的教训还不够多吗? 《锦衣之下》要拍续集?
一部非典型正剧《庆余年》,竟然让我读懂了人生 一部非典型正剧《庆余年
新闻头条
精彩专题 更多>>
横店复工现场显冷清,剧组每天损失至少十万,演员演戏摘口罩说词 1横店复工现场显冷清,剧组
点击排行 更多>>