人工智能的普及者—谷歌
谷歌(Google)押注计算机可以自主学习的赌局,即将面临最重大的考验。
“机器学习”把人工智能(AI)带回到科技主流中,对谷歌而言,这意味着利用它的计算能力来分析海量数据以识别模式并作出预测,从计算用户可能觉得相关的广告,到一幅数字图像显示的是猫还是狗。
“它现在正在解决我们完全不知道如何解决的问题,”自谷歌在近5年前开始聚焦该领域以来一直引领研究的工程师杰夫•迪恩(Jeff Dean)表示。他补充称,谷歌如今约有100个产品团队正在应用这项技术。最新(也最显眼)的产品是一个智能数字助理,旨在开启一个更自然、更智能的人机交互模式,基于日常语言的使用。被称为“助手”(Assistant)的这项功能将于未来几周以不同形式出现在谷歌一系列产品和服务中。
它将有助于谷歌从某些竞争对手最成功的新项目夺取用户。这些包括亚马逊(Amazon)的家庭声控设备Echo;苹果(Apple)的智能助手Siri;以及Facebook的通讯服务——Messenger和WhatsApp。
但是,即使是对于像谷歌那样拥有庞大计算能力和工程设计人才的公司来说,教会计算机更自然更智能地行动,也需要面对一些最棘手的计算机科学问题。
“谷歌当然拥有足够强大的人才实力来挑战这个问题,但是迄今还没人能完全破解,”AI初创企业MindMeld的首席执行官蒂姆•塔特尔(Tim Tuttle)表示。该公司正在打造自己的“对话式”计算平台。
AI领域的很多专家承认,谷歌在机器学习方面领先于其主要竞争对手。
在微软(Microsoft)共同创始人保罗•艾伦(Paul Allen)的研究所负责AI研究的奥伦•埃齐奥尼(Oren Etzioni)称,谷歌在该领域展现了“前沿”成果。他认为,这是由于谷歌采取了比对手更开放的姿态,发表研究结果,并使其技术可以免费获得。这种开源模式帮助它围绕自己的方法建立了一个更大的生态系统。“亚马逊采用了更封闭的模式,在机器学习领域正追赶谷歌,”埃齐奥尼称,“他们吸引到的人才不是同一水平的。
所有这一切都起到了提高期望值的作用,即谷歌“Assistant”在理解语音和提供更智能的指引上将达到新水平,从回答直接的问题,到指导用户完成寻找餐厅或安排航班等任务。但是,期望值提高也大大提升了风险。用户往往很快认为似乎理解语言的计算机具有高智能,当结果不尽人意时会非常失望。
谷歌于今年5月在年度开发者大会上首次透露了“Assistant”计划。该技术将根据使用的设备或服务而采取不同形式。预计将用于一款被称为Home的语音工具产品(效仿亚马逊的Echo)。谷歌5月时还表示,该技术将用于在应用软件Allo中驱动基于文本的智能服务。近日已发布的Allo旨在推动谷歌进入即时信息领域。
凭借这些新方法,这家搜索公司押注很多人都已准备好尝试与数字化设备交互的新方式。据谷歌表示,在美国,Android设备上进行的搜索约20%通过语音完成。
迪恩称,语音识别等技术的进步,使得AI达到了可以面向大众市场的阶段。例如,谷歌称其理解口语单词的错误率(即使是在嘈杂的房间内)已降至8%。
塔特尔称,该公司还在语音识别和文本转换语音(将搜索结果转换为语音回答)等领域取得了“出色的表现”。
这一切成功都利用了谷歌在互联网搜索方面的根基,后者使其可以利用有关一般语言用法的海量数据来推动其核心语言引擎。“在这些方面,谷歌具有优势,”塔特尔表示。
然而,若要在更深层面上理解语言,就必然涉及掌握一句话的背景(往往不明显)或是能够理解一系列遵循人类(而非计算机)逻辑的评论。塔特尔称,这些任务会使“Assistant”等通用工具出错。
为了应对更棘手的挑战,谷歌正在寻求利用深度学习——机器学习的最高级形式。深度学习系统借鉴人类大脑的工作方式,利用多个处理层(就像人工神经网络那样)来过滤数据以得到结果。这项技术特别适合于处理传统电脑不可能完成的任务,比如图像识别。该技术迄今最引人瞩目的应用是在谷歌相册(Photos)的用户相簿中自动识别人或物体。
据迪恩表示,图像识别上的这种突破,如今已经开始出现在语音、语境和语意推测方面;在这些方面,其他程序已失败。“最近出现的情况是,深度学习方法开始在很多不同的任务中表现出了理解语言的能力,”他称。
尽管如此,他承认谷歌的计算机距离人类语言理解能力、或者人类在对话时利用深厚背景知识的程度仍然很远。“我们在理解较短的句子或表达时拥有相当出色的能力,”迪恩称,“但是我们无法理解长程语境和人类在说话时来自其他方面的深层背景模式。
还有一个挑战将限制“Assistant”自动处理任务的情形,把它限制在犯错几率很小的领域。迪恩称,释放一款深度学习程序来识别猫咪照片是一回事,而放手让同样的程序来更改你的行程则是另一回事。在后面一种情形中,细微的误解都会造成极大的不便。
其结果是,新“Assistant”技术的包装——在不过度承诺或让人失望的情况下,找到一套它可以顺利完成的任务——可能会和它本身作为根本性技术成就的成功同样重要。“最好的技术并不总是转化为最棒的产品或市场上的赢家,”埃齐奥尼称。
在眼看着亚马逊以开创性的Echo先声夺人、苹果以Siri抓住大众想象力之后,谷歌是时候在“Assistant”的帮助下重新成为关注焦点。(FT)