充满人工智能气息的IOS10
9月13日,苹果用户可以正式更新全新的 iOS 10 系统,更新后的 iOS 系统可以让用户随意找到在任意时间和地点、有关任意人或事物的照片。iOS 10 系统利用了人工智能神经网络技术,用户每次拍摄照片的0.1秒内会进行约110亿次运算,可以找出照片中的人物是谁,甚至以及他们处于什么样的情绪。
本次 iOS 10 照片应用程序仅仅只是 AI 技术走向“手持设备化”趋势的一个最新例子而已。比如今年一月份所发布的应用程序Aipoly,能够识别出各种物体,并为视障人士大声播放物品名字。还有,谷歌翻译现在可以在你拿起相机对准文本内容的同时,将内容文字即时翻译成另一种语言。现在这类运算可以做到非常之快,甚至在你意识到之前就已经完成。
就在“云技术”正成为“它是如何运作的?”这类问题的唯一答案时,智能手机却反其道而行,朝着独立运行的方向发展。
AI 技术已经可以在手机上独立进行任务处理,而无须像以往那样,需要一个庞大的云端服务器群提供支持。这样做的结果,是用户在使用 AI 技术的时候,不会再产生网络链接数据中心时的恼人延迟,用户将会得到更自然和顺畅的使用体验。
“当我说,‘嘿,Siri,这是什么?’的时候,需要两秒钟来把图片发送到云端才能获得响应,” 创始人之一Alberto Rizzoli说,“这有点像在与一个刚睡醒的人聊天。”实际上,Aipoly不是第一个帮助视障人士识别物体的应用程序,而是第一个通过减少对云端的依赖而在智能手机上独立运行AI技术来即时识别物体的应用程序。
根据高通(Qualcomm)产品经理 Gary Brotman 表示,这类即时AI技术,将可以精确而又详细地绘制周围的地理环境,然后在其中植入具有丰富细节的3D物件、字符和动画,最后呈现在用户的智能手机或其他电子产品的显示屏幕上,这将远远超过游戏 Pokémon Go 里所使用的 AR 技术。
同样,VR 技术与智能手机上的 AI 技术结合后将显得更加真实。“要实现上述效果,一切都得是完全实时的,”他说。“所以你必须能够在展示视频、音频的同时,由人工智能技术来实现眼球追踪、头部跟踪、手势跟踪和空间声源跟踪。”
AI 技术同样也可以为人们的生活提供便利。Rizzoli表示,虚拟助手可以利用手机的摄像头来识别人们的位置,比如在一个特定的街道边或餐厅里,然后关联到相关的应用程序。而这一次,实时AI技术将使得类似的给人们带来极大便利的功能不再受到网络延迟的影响。如果未来的AI技术不再需要云端支持,那么云计算同样也不再需要人们的个人数据。
“无论出于对隐私原因、延迟原因还是其他各种各样原因的考虑,AI技术的分析和控制中心都应该被安装在手机上,而不是云端。”Brotman说道。
内置人工智能
是什么在驱使着将 AI 技术应用到手持设备中?答案是视频游戏。
“人们想要在他们的手机和ipad上体验到更好的手机游戏,”Rizzoli说。“所以苹果、高通以及其他芯片制造商在追求更佳的性能上一直表现得很出色。”实际上,这也是手机CPU和GPU往更强性能的方向上发展的重要推动力。CPU大多是按照顺序分步完成任务,而GPU在进行3D图像快速渲染时则是并行地处理数量巨大的简单任务。AI技术也需要串联地执行多个并联起来的简单任务。
以现代图像识别领域内的主要技术——“卷积神经网络(CNN)”为例,卷积神经网络(CNN)模仿大脑视觉皮层的工作原理,把视觉领域分成重叠的图片块,然后按照特定的顺序,过滤掉简单的细节,例如所有的图片块边缘。当这些信息到达某一神经层(人类的生物层面或者软件的虚拟层面)的时候,这一层的神经元可能会把边缘结合成线,而到达另一层神经元的时候,则可能识别出图片的主要形状。每一层(数量上可能达到几十层)进一步改进图像的感知器。
“你看一张照片时候,你同时也在确认它里面的各种信息,”Rizzoli说,“当你在确定图像边缘的时候,你也在确认图像可能存在的形状。而且所有这些确认行为可以并行地同时完成。”
实际上,智能手机的芯片已经经历了几年的挑战。2013 年发售的iPhone 5s在本次iOS 10的更新中,仍然能够支持新的人像识别,场景识别和对象识别。Aipoly也在制作数个版本,使该软件可以在几年前发售的iphone5和安卓手机上顺利运行。然而程序员们最近才能充分利用好这种新技术,今年六月推出的照片效果处理软件Prisma,便是这种技术的最早应用者之一。
二十五岁Aleksey Moiseenkov 创建的 Prisma,可以将智能手机的照片渲染成30种不同艺术风格的应用程序,比如“尖叫”、“蒙德里安风格”,以及一些有趣的标题诸如“美到犯罪”“火焰喷射器”以及“#进城”。与其复杂程度不相匹配的是,渲染效果的呈现几乎是瞬时完成的。
一个Instagram上的滤镜只是通过预设之后简单地调整图像的基本参数,如颜色、对比度、亮度或是白平衡。而Prisma则需要分析图像以及识别出图像的基本信息,如形状、条纹、颜色和材质,然后就像Edvard Munch(挪威画家,1863~1944)或者 Piet Mondrian(荷兰画家,1872~1944)一样,在随意涂鸦一样重新画出来。即便开始时输入的是平庸水准的照片,通过如此处理后的成品效果依然可能会大放异彩。
Prisma的所有处理过程最初全都是在云端进行的,然而Moiseenkov却认为依靠云计算可能会影响到这个应用程序的使用质量。“我们在亚洲有很多的用户,”他说,“我们需要给予他们始终如一的优质体验,无论用户是使用何种方式链接的网络,以及无论服务器或者云计算服务器位于何处。”该软件在8月份更新的iPhone版本中,已经能够在iPhone上完全独立地完成所有处理过程,Moiseenkov现正集中精力在研发该升级的Android版本。
将同样的艺术效果渲染技术适用于视频处理的升级可能也会在9月份推出,Moiseenkov说。“按照之前在云端的处理方法,视频的处理将会复杂得多,服务器和其他相关的东西随时都有可能超载”,他说,“所以,使视频可以在手机上完成效果处理是至关重要的。”
Moiseenkov和他的团队需要找到让AI程序能够在智能手机上流畅运行的方法,这项工作对于未来的程序员来说可能会较容易实现。
今年5月,高通公司推出了一个专为高通骁龙 820芯片设计的,名为“神经处理引擎”的软件开发工具包。该款芯片被广泛使用于2016年的高端安卓手机中,比如三星Galaxy S7和Note 7,Moto Z和Z Forece,OnePlus 3,HTC 10 和LG G5。这个名为“神经处理引擎”的软件开发工具包可以在并行处理CPU、GPU任务的同时,还可以支持芯片的其他组件来完成其他工作,比如场景识别、文本识别、人脸识别和自然语言处理(能够理解对话内容而不仅仅是严格的执行命令)。
另一方面,AI专用芯片也已经问世。一家名为Movidius的公司制造的VPUs(视觉处理器,Vision Processing Units)专为计算机视觉神经网络技术进行了优化,使之取得更佳的效果表现。比如,该公司最新的Myriad 2芯片被应用在大疆公司的幻影4无人机上,帮助无人机发现和躲避障碍物,以及跟踪骑行者或滑雪者的移动轨迹。就在本周,芯片造商巨头英特尔公司宣布将收购该公司。
Myriad 2芯片在智能手机上运行时,将仅仅消耗1瓦特的电力。值得注意的是,Movidius公司对未来的产品曾做过一些模糊的表述。6月份的时候,该公司宣布“与联想公司达成战略合作伙伴关系,为其各种产品的VR核心部件提供先进的视觉处理技术”。这可能指的是联想的VR外设或者带有VR功能的手机,又或者两者兼指。
早在今年1月,Movidius和谷歌公司宣布达成了一项关于“优化和加速采用了深度学习技术的移动设备”的合作,当记者寻求Movidius和谷歌此次合作的更多信息的时候,双方均表示没有更多的消息需要披露。
The iBrain
在六月份苹果公司发布iOS 10的预览之前,苹果对于其在人工智能产品的规划上一直显得十分神秘。
苹果表示,赋予了AI技术的照片功能是AI技术使用得最多的部分。它使用了深度学习神经网络技术来识别场景和对象,还可以识别照片中的人脸并且使这些照片可以被方便的搜索到;它的记忆功能可以依据照片或视频里的人物、地点和具体事件(比如某次旅行)自动生成一个相册。而且,苹果强调,所有这些新功能将在充分保证用户隐私安全的情况下完成。
同时,神经网络技术也能够帮助苹果设备在预测文字输入并自动完成语句上做得更好。在iOS10之前,AI技术已经在苹果设备上运行良好。早在2014年的7月,苹果就已经利用神经网络技术,将siri转变成能够在手机上运行的语音助手,以改善其语音识别能力。
目前来说,Siri 是APP开发商们在需要调用苹果设备的AI技术时使用得最多的通道。尽管苹果目前并没有像高通公司为骁龙芯片所做的那样,为其自己的A系列芯片放出AI软件开发工具包,但是一个名为SiriKit的功能组件可以利用Siri语音助手作为通道,帮助开发者们的APP连接用户。
苹果在帮助第三方开发者利用AI技术上,可能并不会一直远远落后于高通。有报道称,苹果最近花了2亿美元在一家名为Turi的公司上,该公司专为程序员开发AI工具。同时,开发者们在利用AI技术上也将变得更加得心应手。在CPU运行速度和图形处理上,苹果iPhone 7 和7 Plus上搭载的最新A10芯片比上一代iPhone分别快40%和50%。
随着AI技术对整个科技世界的影响力持续扩大,智能手机自然首当其冲。人们对于各种电子产品能够理解我们所需所想的期望与日俱增。“我可以说,大部分的移动APP将成为AI应用程序”,一个专注于医疗助手APP的AI工程师和顾问Nardo Manaloto表示。
在1月份的电子消费展上,Alberto Rizzoli希望能够看到更多的全新APP。“当有更多的深度学习软件可以使用的时候,开发者们自然会选择跟进。尤其是作为开发者,他们更能够意识到这一趋势”,他说。“尽管在许多IT从业者眼里,AI技术仍然是一项黑科技,但其实他们错了。”