8月下旬,Motherboard 爆料说微软已经与承包商共享Xbox用户的录音,以改善其AI语音助手的功能。该月初,另一份报告显示,微软正在与承包商共享 Skype录音和Cortana语音命令,以改善聊天平台的服务。一些录音包含私密的内容。

微软只是雇用人工来侦听和注释用户生成数据的几家公司之一。最近几个月,谷歌,亚马逊,Facebook和苹果公司已经建立了类似的程序,这些程序已经确立了用户隐私保护的倡导者地位。

随着语音助手和聊天机器人的日益普及,科技公司面临着一个艰巨的挑战:他们的AI算法无法处理人类语言的复杂性,并且他们常常无法理解用户命令和句子的含义。说。

目前,唯一的解决方案是雇用人员以正确的方向引导这些AI算法。这通常需要让这些工作人员听取用户的亲密谈话,以便对他们进行转录和注释。

语言理解的挑战

AlexaSiriCortana之类的基于语音的助手的能力归功于深度学习的进步,而深度学习人工智能的一个分支,在过去几年中非常流行。深度学习算法特别擅长查找模式和分类信息。

当您提供具有数百万个语音记录及其对应文本的深度学习算法时,它可以非常高精度地转录新的音频摘录。深度学习还擅长预测:当您在大量文本集上训练AI算法时,它会开发出不同单词序列的复杂数学表示形式,并且可以执行诸如自动完成句子之类的任务。

但是深度学习要努力理解单词和句子的含义,这是单纯依靠数学和统计学无法完成的任务。

Robust.AI的认知科学家,认知科学家Gary Marcus说:“语音识别和自然语言理解可能听起来像是类似的问题,但实际上却完全不同。” “在语音识别中,您的语言中的音节和音素数量有限,并且您正在尝试将音频流转换为属于很小类别的内容。”

英语具有成千上万个常用单词,在大数据时代,您可以轻松地找到数百万个示例,每个示例都可以用来训练深度学习模型。但是解析句子并解释其含义是完全不同的努力。有无数可能的句子,每个句子都有其独特的含义。单词的含义会根据它们在句子中的位置以及其前后的位置而有所不同。

“除了几个小句子,几乎您听到的每个句子都是原创的。您没有直接获得任何数据。这意味着您在推理和理解上存在问题,” Marcus说。“对于将事物进行分类,将其放入您已经知道的垃圾箱中的技术而言,根本不适合这样做。理解语言是将您已经了解的世界与其他人正在尝试使用的单词联系起来他们说。”

在新书《重新引导AI(与纽约大学教授欧内斯特·戴维斯合着)中,马库斯解释了当代AI在解释人类语言含义时所面临的一些挑战。我们理所当然的事情之一是我们每个人都拥有的世界常识以及我们如何利用这些知识来消除口语和书面语言的歧义。

每天的谈话都充满了这种含糊。例如,考虑一下这句话,马库斯(Marcus)和戴维斯(Davis)在书中对此进行了检查:“艾尔西(Elsie)试图通过电话联系她的姨妈,但她没有回答。” 这是一个简单的句子。但是,它还包含您作为人类可以轻松解决的多个歧义。听到句子后,您将立即知道“到达”是指“交流”而不是“实际伸出手”,“在电话上”是指“通过使用电话”而不是“在电话上”和“她” ”是指Elsie的姑姑,而不是Elsie自己。这些都是您可以不用思考就能做出的推断,因为您知道电话的用途,用途以及拨打电话的过程。

无休止的训练周期

深度学习缺乏常识和对世界的了解,这使科技公司别无选择,只能继续训练越来越多的实例来训练他们的AI模型,希望他们最终能涵盖所有可能的方式来表达AI助手应该做的事情。这就是为什么他们需要人工的帮助,他们通常是远程的且薪水低廉,他们可以评估AI算法的性能,或者转录和注释AI算法无法解密的用户录音。

但是,鉴于人类可以无休止地表达事物的方式,更多的培训最终将成为创可贴解决方案。总是存在离群点,即未经AI处理的场景;人类语言是动态的并且不断发展。这一切都需要更多的培训,这意味着您将听到更多有关远程办公人员收听私人对话的故事。

Marcus说:“当前技术的弱点在于它极度需要数据,特别是在诸如自然语言理解之类的开放性问题中。因此,公司迫切希望获得这些数据。” “我认为无论如何都不会真正解决他们的问题。虽然会有所帮助,但无法解决。”

如果没有将常识和基础知识嵌入到深度学习算法中的方法,就不会在短期内解决该问题。随着科技公司继续收集和注释用户数据以训练其AI算法,他们将面临隐私权倡导者的强烈反对以及数据保护机构可能采取的法律行动。这导致这些公司淡化并重组其数据收集和共享程序,但并未停止。

8月下旬,Apple在其网站上发布了未签名的道歉,以便与承包商共享Siri语音命令。该公司承诺仅在人们选择参加评估计划时才将其录音用于培训。Google 暂停了其在欧洲的评估计划,因为欧洲的数据隐私规则更加严格,但该计划在其他领域仍未减弱。Microsoft已更新其隐私政策,以明确规定人类承包商可能正在听您的声音。亚马逊对其程序进行了更改,使用户可以选择退出其评估程序,许多用户会忽略甚至不知道。

从长远来看,Marcus认为,我们需要对AI提出新的看法:“我们需要对AI进行更好的研究。这意味着将一种主要涉及数据和数学的文化转变为一种也包含了心理学等其他领域的其他思想的文化哲学和语言学方面,人们对人脑的运作方式进行了深刻的思考,并且可能会导致构建人工智能的技术比我们现在真正看到的更加丰富。