分享到微博 分享到人人 分享到LinkedIn 分享到Email
每一个人的人工智能

编者按

1月14日,未来论坛2017年会暨首届未来科学颁奖典礼在北京拉开帷幕,微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋受邀在此次论坛上发表了主题演讲。本文包括沈向洋博士此次演讲内容的视频和文字整理,希望与大家分享微软对人工智能的理解和对未来的美好愿景。

观看演讲视频 

人类今天面临的最重要课题之一就是人工智能。纵观人类历史上的诸多创新,像汽车、印刷机、蒸汽机、载人飞机、火箭和人造卫星……它们都不只是孤立的创新,更是推动人类在浩瀚无垠的各领域里迅猛发展的加速器。

人工智能也许是迄今为止最强有力的加速器,因为它不仅使人类的能力得以延展,还让我们的脑力变得更加强大。它不仅仅是数字时代的一个进步,而是包括图灵在内的很多人,在电脑诞生前就梦想到的终极目标。大型机、个人电脑、互联网、移动电话、云……这一切都是人工智能的前奏。

回溯过去几十年,人工智能的发展历经高潮与低谷。现在又有哪些不同?三大创新最终将人工智能带上了快车道。互联网、大数据和传感器随处可见;特别是基于云平台的大规模计算能力;得益于突破性算法的发展,计算机已经可以凭借深度学习独立完成更为复杂的任务。

正因为这些突破,人工智能已经无处不在——它可以为你推荐所选,保护你免受信用卡诈骗,个性化处理你的新闻推送,并让你的家智能互联。微软正在保护你的Outlook邮箱不受垃圾邮件骚扰,并赋予智能聊天机器人小冰以声音与个性。然而即便如此,我们现在不过是触碰到了人工智能潜力的冰山一角。

对于微软而言,人工智能不只是一个关注的焦点,更是我的第一要务。过去25年来,我们一直在通过各种方式为这一轮创新做准备。25年前比尔·盖茨创建微软研究院时,他就曾设想有一天创造出通用人工智能,一个会看、会听、能讲,并且能够理解人类思维的电脑。

多年来,我们吸引了全球的顶尖人才加入我们的研究院,一起迎接这些挑战。我们的国际团队是首屈一指的。锦上添花的是,我们刚刚宣布收购Maluuba,这是一家总部位于加拿大蒙特利尔的公司,拥有全球最领先的人工智能研究和工程团队。

除此之外,作为全球最重要的深度学习研究专家之一、蒙特利尔学习算法研究所所长和Maluuba顾问,Yoshua Bengio也将成为微软顾问,并直接和我互动。

我的团队已经取得了一些激动人心的突破。就计算机视觉而言,我们的视觉算法正接近人类的水平!微软在诸如ImageNet 1K这样的图像识别比赛中屡次斩获大奖。更令人兴奋的是,我们在视觉算法方面的成果已经被用在微软自己的产品上,比如HoloLens;同时也运用在日常应用上,比如为UBER这样的客户验证驾驶员身份。

计算机正在学习像我们人类一样去看,并为它们识别出的东西命名。现在它们也能像我们人类一样倾听和识别语音。三个月前,微软的语音识别技术在行业标准Switchboard测试中首次达到了人类同等水平,而这个目标在几年前还看似遥不可及。

随着我们在语音识别领域能力的提高,我们在面对诸如自然语言等更复杂的挑战上也取得了实质性进展。世界上有6500多种语言。试想如果我们都能相互理解,这将意味着什么!就在上个月,我们的Microsoft Translator取得了巨大的飞跃。Microsoft Translator能实现包括中文普通话在内9种不同语言之间的实时语音翻译,最多允许100人同时进行群组交流。我们采用了一项令人兴奋的深度强化学习技术,并在此基础上运用了对偶学习,来加速提高翻译能力。

我们正在接近目标,让计算机可以做某些人类力所能及的事:看、听,并开始描述它们周围的世界。但人类更了不起的地方在于,我们不会止于感知,我们会继续向认知深入。我们会将想法、概念与世界上的人、地点与事物联系起来……并了解它们彼此的关系。这就是我们所说的“常识”。

这对人类来说再普通不过,但对计算机来说却是一项异常艰巨的任务。多年来,源于在必应搜索(Bing)的研究和实践,我们建立了一个庞大的知识图谱。我们了解数十亿计的实体——人、地点、事物。我们既拥有“关于世界的知识”,也拥有令人叹为观止的 “关于工作的知识。”以Office 365和LinkedIn为例,通过将这些特有的工作数据与视觉、语音以及语言识别能力相结合,微软就可以打造出能将个人生活与职场生活统一相连的人工智能助理。

虽然取得了这些进展,但人工智能还未能实现通用智能。计算机可以顺利完成特定任务,但当面临通用任务时,它还不如一个小孩做得好。我们在人工智能涉及的所有领域里都已取得了巨大的进步,但要实现通用的人工智能,仍有很多工作要做。

首先,我们要让计算机理解我们,而不是强迫人们去理解计算机。实现这一想法的核心在于双向对话:计算机很难像“人类”一样讲话。我们称之为“对话式人工智能”,这也是人机交互下一步要实现的目标。

回溯图形用户界面的诞生,它让每个人都能使用个人电脑。而对话式人工智能更是颠覆性的。我们能在任何地方使用它,不再受屏幕与键盘的束缚。我们也不必再去适应计算机的规则。相反,计算机会来理解我们。当计算机能像“人类”一样说话时,每个人都可以和计算机对话与协作。

为实现这个目标,微软着眼于“人类智能”的含义。人们明白许多事是没法用IQ(智商)来衡量的。在你我交谈的时,我们时时刻刻都会留意对方的语调和手势。我们能理解文字游戏——比如幽默、讽刺、嘲笑,或夸张。我们称这种情绪理解能力为EQ(情商)。要打造成功的人工智能,EQ与IQ同样重要。我们要让人工智能助理理解我们真正的意图,就像你我一样。

拥有EQ和IQ,智能助理能让计算实现真正的人性化。它们将了解我们:认识我们是谁,甚至明白我们的感受。它们将预判我们的需求,让我们按计划行事。它们不会拘泥于任何一种单一的设备;相反,只要我们需要,它们能随时陪伴左右。比如目前,我们已经与汽车厂商合作,赋予小娜这样的能力。

而最终,得益于人工智能,计算机会越来越像人类。但我想人工智能也许还可以让人类变得更好:人工智能会增强我们人类的能力。它会赋予每个人以“超能力”来应对各种挑战——包括最艰巨的挑战。

以教育与英语学习为例。要掌握英语口语,每个学生都需要跟老师一对一练习,这样才能直接得到老师的反馈。可老师没有“分身术”——他们可以同时指导几十个学生,但给每个人的关注也因此降低。人工智能就能解决这个问题。微软研发了自己的虚拟英语老师——微软小英。基于微信服务号,微软小英能为用户提供免费服务。现在,微软小英已拥有超过80,000名用户,我们正与中国日报双语新闻微信公众号合作,读者可以用它测试自己的英语词汇量。

这个世界充满挑战。但我们非常乐观!借助人工智能,我们可以在人类力所能及、想象力所及的范围内取得更迅猛、更深入的发展。人工智能的故事还没讲完,正如计算机领域的传奇人物Alan Kay所说:“预测未来最好的方式就是创造未来。”

作为与人工智能共同生活的第一代人,这就是我们要做的事情。在世界各地,微软“梦之队”正在努力践行我们的使命——予力全球每一人、每一组织,成就不凡。

我们正在开发的人工智能,将增强我们作为人类所独有的素质——我们的好奇心、爱心、创造力,以及我们对于一个更美好世界的共同渴望。