分享到微博 分享到人人 分享到LinkedIn 分享到Email
人工智能,一个很好的“左脑”

作者:微软全球资深副总裁、微软亚太研发集团主席兼微软亚洲研究院院长 洪小文​​



近两年来骤然加速的人工智能(Artificial Intelligence)技术,让其无论是在业界还是在社会上都广受热议。有人觉得它很厉害,有人觉得它很可怕,那么我们到底该如何看待人工智能呢?

身为一个探索该领域多年的研究人员,我认为计算机应该是一个很好的“左脑”。通过相应的算法,计算机可以做大量重复性及逻辑推理的工作,这与负责逻辑思考和推演解决问题步骤的“左脑”十分相近。但人最了不起的地方却是“右脑”,是它给我们带来了想象、创造力和意识,而这些是机器所无法具备的。

​我们需要机器有意识,并且深不可测吗?我想大概不需要。因为研究人工智能是希望它能够随时为我们所用,并且完全可控。在我看来,人和机器之间的关系,更多是Human(人)+Machine(机器)=Superman(超人)的关系,最终做出人独立做不到、机器也独立做不到的事情。假设,我是一个股票分析师,我可以让机器根据我的算法去分析数据,然后我再去调整它的分析结果并进一步优化算法,两方面配合就可以帮助大家将利益最大化 。所以,让机器去看数据,会看到什么背后的价值和意义,关键还是在于人。

因此,我要把人工智能的AI扩充为四个含义:Agglomerative Intelligence(聚合的智能),Adaptive Intelligence(自适应的智能),Ambient Intelligence(隐形的智能)以及Augmented Intelligence(增强的智能)

Agglomerative Intelligence,人工智能是一个聚合的表现。以微软小冰为例,她是在抓取并“学习”了社交网络上人与人的对话之后,才建立起了自己的聊天问答数据库。目前小冰与真人的平均对话(CPS)已经达到了23个回合,这就让她能够进一步优化原有的数据库。

除了文字、语音聊天,现在的小冰还可以看“图”说话。你给她发一张人脸,如果颜值高,她会多谈外表,如果颜值低,她会谈内涵;若是发一张食物照片,她会说“看得我都流口水了”。在跟京东的合作中,小冰又可以辨认上千万的书籍、数码设备,以及各种衣服的面料、款式和风格,甚至可以给用户实用的购物建议,为下一代的内容广告奠定基础。而在发布了微软学术搜索之后,小冰、小娜还将能跟你聊学术。

​如今,俏皮的小冰背后融合了计算机图像识别、语音识别、自然语言处理、社交网络情感计算等等不同方向的人工智能技术。未来她将不再只会谈风花雪月,涉猎的话题会越来越丰富。

Adaptive Intelligence,人工智能要可以自适应。微软的研究中与之最为相关的就是微软牛津计划(Project Oxford),目前它提供了人脸识别、语音识别、计算机视觉和语言理解智能服务四大技术方向的API。基于此生成的成果中,大家最熟悉的应该莫过于How-Old.net,但它的代码只有不到20行。

在相对简单、固定的环境里,机器在这几方面的识别能力有时甚至超过了人,但如果是在嘈杂、混乱的环境里,即便是人,可能在不了解对方所讲/所展示的内容的情况下,要去识别也是非常吃力的。那么要让机器能够适应更复杂的环境,便是其适应能力的体现。而利用牛津计划所提供的API,开发者将不受环境、物体等限制,可以充分发挥自己的灵感来实现更多创意。

此外,在我们利用深度学习的方法处理IQ测试里文字推理问题的研究中,计算机通过学习、借鉴语料库中的词语语义,可以判断一个词的多重含义、词类变化以及词条的特征向量。这也体现了人工智能的自适应能力。其实,每一项人工智能技术都要可以自适应,它们没有固定的限制,可以适应各种人、环境、物体、语义等等。

Ambient Intelligence,让所有人工智能都自动地无缝实现。小娜因为被嵌入在Windows 10当中,便能跟随Windows 10跨平台到任何一种设备,无论是台式电脑、笔记本电脑,还是平板电脑、智能手机。但她不会每到一个新平台就提醒你一遍相关事宜,也不会在你使用台式机时要求你像使用智能手机一样必须按住屏幕才能与她对话。你只需对着台式机说出你的需求,她就能识别出你的声音并按指示行事,所有事情进展得自然而平顺。

而另一个隐形智能的例子是摄像头,通常我们需要人看着摄像头才能知道是否有异常发生,但现在我们可以做到一旦摄像头“看”到有人摔倒,就会自动叫警卫来帮忙。原理跟语音识别类似,将人们摔倒的视频拿去让摄像头学习,一定次数之后,摄像头自己就“明白”——发现有人摔倒就报警。今后,物联网的发展会带来更多传感器,隐形的智能便可以在更多范围内实现。

Augmented Intelligence,就是用人工智能这个了不起的“左脑,与人类的右脑相配合,充分利用人类才有的创造力,延伸出无限可能。从石器时代开始,人类就很熟悉关闭反馈回路(Closing the feedback loop)这件事,例如用石头打造一把尖刀用来切肉,先是不断打磨石头,磨到一定程度去试着切肉,发现哪些地方还不够锋利,就继续打磨。互联网时代下的我们,做产品仍然如此,但不同则在于以前做一个实验可能要几年甚至几个世纪,但在如今的数字化环境下,一天就可以做几百个实验。

近两年机器学习、大数据等新兴技术的发展让AI远比以前更强大。但无论有多强大,AI目前也只能停留在功能和部分智能的层面,之所以说是部分智能是因为“智能”的概念也在不断改变,以前机器下棋绝对被认为是一种智能,但今天说起记忆力、算数和弈棋(不包括围棋)计算机比人类更在行,大部分人却不会认为这些有多么高智能。所以我更愿意将AI称为数据驱动和基于统计的人工智能,它更像是一个能干的“左脑”,必须与人类的右脑相结合,才能带来Superman那样更强大的智能。

本文节选自洪小文博士在第十七届“二十一世纪的计算大会”上的演讲,观看完整视频:人工智能时代