数据里奥斯说 篇四:“小爱同学”们,离真正的智能语音助手还有多远?
为什么要有智能语音助理?
21世纪以来,IT技术经历了几位快速的变革,从互联网时代,再到移动互联网时代,如今,随着人工智能和5G技术的飞速发展,IoT时代,也就是大家常说的物联网时代,将很有可能会成为21世纪第三个十年的注脚。
所谓物联网时代,简单来说,就是万物互联。在互联网时代,我们只是和电脑/手机产生交互,而如今,我们生活中的每一台电视、每一台空调、每一盏灯、每一辆车,都将会与我们之间产生交流。没有了传统的鼠标和键盘,我们和万物之间的交互,也将同人与人之间交流一样,通过语言交流。而像小爱同学们这样的智能语音助理,理所当然承担起了人类与万物互联的沟通桥梁。
“小爱同学?” “哎~”
“你愿意成为我的私人助理么?” “好啊~”
怎样才是一个合格的“类人”助理?
其实这个标准很简单,机器如果能和你的朋友一样,很自然的交流,回应你的各类诉求,甚至偶尔还能如暖男般猜到你的潜台词,想你所想,那就会是一个非常优秀的助理。
如何能够进行“自然的交流”呢?智能语音技术,就是为了实现人机语言的这种自然通信。其中最重要的两个技术领域,就是语音识别技术(ASR)和语音合成技术(TTS)。而这两个技术,分别解决了语言交流中最重要的两个问题:
语音识别技术(ASR)将人类的语音中的词汇内容转换为计算机可读的输入:听的懂人话
语音合成技术(TTS)通过机械的、电子的方法产生人造语音:像人一样回应
怎样才能算听的懂人话?
让机器听懂人说话,这看似简单,可是机器在学习这一本领时,却已经走过了几十年艰难漫长的道路。
语音识别技术研究的开端,是Davis等人研究的Audry系统-------第一个可以听懂几个英文字母的系统。到了20世纪六七十年代,随着人工智能理论的发展,人类对于语音识别的技术取得了长足的进步。语音识别技术逐渐由当初的字母单个识别,发展到了连贯语句的识别,甚至是实时翻译的高阶水平。而中文由于其独特的复杂性,同音不同字、同音不同词、同词不同意等高阶复杂的情况要远多于英语语境。如今,我国的语音识别技术已经和国际上的超级大国实力相当,其综合错误率可控制在10%以内。
如今的语音助理,基本可以听得懂你在说什么:
“小爱同学,帮我关灯” “好的,灯关了哦”
不过,当你的语音里混杂有多国语言,或者是方言时,她还是有些力不从心:
“小爱同学,我豆子痛(肚子痛)” “呵呵呵呵呵” -----本条摘自某网友吐槽
你在嘈杂的环境里呼唤它时,它可能也听不到你对它的呼唤:
(播放音乐中)“小爱同学,电视太吵了关小一点” “……”
当然,这听起来也不算太糟,即使是一个真正的人,在许多特殊情况下也很难听懂一些语句,比如北京人也许也听不懂粤语。
不过,既然是智能语音助理,我们对它自然会有更持续、更高的期待,我们期待中的助理,不仅仅是一个耳聪目明,智力正常的人,更希望它会是一个精通多国语言、熟悉各地方言,甚至谙熟“打工人”这种经典网梗的圆滑小机灵鬼。
怎么才能像人一样回应?
过去我们常常挂在嘴边的一句话叫:机器是冰冷的,而人是有温度的。这是因为对于传统的机器而言,所有的问题都被归为0与1的问题,通俗来说,在它的眼里,同样的问题只会有预设的答案,不会因为问的人不同,环境不同,时间不同而发生任何改变。
“小爱同学,你是谁” ,“我是小爱,你的智能语音助手”
而人的回答,是有温度的,你对她说“今晚的月色真美。” 她会说,“我也爱你。”
之所以会有这样的区别,最根本的区别,人是有记忆和情感的,同时这种记忆和情感会对所有的反应做出影响和改变。
小爱同学在5.0新版中,提出了一个重要的概念叫:对话式主动智能。其目的,就是要让小爱同学对人的应答更接近人类,变得更有温度。
对话式主动智能最重要的三个特性是:
一、主动尝试和用户沟通增进了解,打造个人专属体验
二、小爱同学会记住用户专属的小细节,并在合适的场景反Cue用户
三、定制化情感声音,学习人类的语音语调
怎么去理解智能语音助理的学习能力呢?其实你可以把它想象成女孩子找了一个理工科直男当男朋友,可能你刚认识他的时候,他是这个样子的:
“我好冷啊” “是的今天很冷~” “...” (相信我,现在的小爱就是这样的直男)
但是拥有主动智能的智能助理,就像直男拥有了一颗愿意为你去学习、去改变的心,当你告诉他下次你说冷的时候是要让他调高空调温度,你说你要睡觉的时候是要让他关灯,他就会默默记在心里。
“小爱同学,我要睡觉咯” “好的,帮你关掉卧室的灯了,好梦哦~”
“小爱同学”们,离成为真正的“智能助理”,还有多远的路要走?
也许机器永远获得不了真正的人类思维,但是人类在不断探寻帮助机器进行学习、感知和思考的过程中,也在不断地重新认识自己,每一次我们教会这些智能助理新的能力时,恰恰是我们希望人类自己能够具备的良好能力或是感情寄托,我们何尝不希望自己身边的人能够对自己嘘寒问暖,急人所急呢?
小爱同学、Siri、Alexa、天猫精灵、小度小度,短短数年,基于人工智能的语音助理如雨后春笋般涌现,以手机,音箱,电视灯多种形式走入了千家万户。
尽管他们有些话还听不懂,有些事情还不会做,但是他们拥有的“学习能力”,让我们对他们有朝一日,成为真正的生活工作管家充满了期待。
迎风又破浪
校验提示文案
迎风又破浪
校验提示文案
young_forever
校验提示文案
seyoumase
校验提示文案
某80工地佬
校验提示文案
[已注销]
校验提示文案
[已注销]
校验提示文案
某80工地佬
校验提示文案
seyoumase
校验提示文案
迎风又破浪
校验提示文案
迎风又破浪
校验提示文案
young_forever
校验提示文案