苹果已秘密加入谷歌亚马逊行列,使用承包商对其用户录音进行分析。在一名举报人将录音带到英国《卫报》(The Guardian)后,苹果证实了这一做法。这人说,Siri查询会定期发送给人类听众进行更细致的分析,但苹果在其隐私政策中并未披露。
据报导,这些录音与苹果身份认证(Apple ID)无关,但可长达数秒,包含个人性质的内容,并与其它显示资料如方位、应用程序资料和联络人详细资讯配对。
与其它公司一样,苹果说这些资料由真人搜集并分析,以改进其服务,且所有分析均由受保密协定约束的员工在安全设施中完成。而苹果也没有自动承认这一做法。
苹果告诉《卫报》,每天发送的查询不到1%,但当苹果于无意之间不断谈论Siri查询数量时,谈到数以亿计的设备也经常使用该功能,1%则激增为成千上万了。
正如举报人指出的,Siri录音中包括:医生和患者之间的私人交谈、商业交易、好像是罪犯之间的交易、性接触等。
Siri的某些录音是出于偶然,这是为什么需要培训才能收听并识别的原因之一。意外录音有时长达数秒,且包含大量个人资讯,即便不与数位识别码直接绑定。
语音助理要想「掌握」一门语言,需要解决两个问题:声音识别和声音合成。其中声音识别是对机器输入资讯,又分为两步,分别是:第一步,将语音转成文字的语音识别;第二步,语义理解,这里就需要用到自然语言处理技术。
但就目前而言,就算各家宣传把语音助理、智能音箱吹嘘得功能强大,它们依然只是初级人工智能。想让机器听懂人类语言,并准确「聪明」回应,依然需要大量人工介入。
苹果并不是第一家被爆语音助理对话录音会被其他人听到的科技公司,当然也不会是最后一家。
今年4月,彭博社消息显示,亚马逊(Amazon)在全球雇用了数千名合同工,他们会听到某些来自Echo智能音箱的使用者语音请求,并负责注释标记这些转录语音,以提高Alexa识别人类语言的能力。
7月11日,谷歌(Google)证实于全球各地聘请承包商员工收听一小部分录音,并表示搜集的部分音档用于开发语音识别系统,以更适应各种语言,提升使用者体验。