分享到微博 分享到人人 分享到LinkedIn 分享到Email
NIPS 2016:普及机器学习

左起:微软研究员Robert Schapire,John Langford,Alekh Agarwal,Siddhartha Sen,Jennifer Wortman Vaughan。摄影:John Brecher

当Robert Schapire在30年前作为研究生开始攻读理论机器学习,该领域是如此模糊,以至于现在已经跻身国际一流研讨会的NIPS,在当时只是一个小规模工作坊,连研究生都长期被排除在外。

今天,虽然机器学习仍然算不上家喻户晓的热门话题,但它已经成为计算机科学最热门的领域之一,把曾经身份模糊的学术聚会,例如正在西班牙巴塞罗那举办的神经信息处理系统年会——NIPS 2016,变成一票难求、数千名来自顶级公司和学术机构的计算机科学家争相出席的行业盛会。

微软纽约研究院首席研究员Schapire表示:“在我的有生之年看到该领域的长足发展,看到许多事情由不可能变为可能,这简直太了不起了。”Schapire的机器学习研究在该领域被广泛采用。

本周一拉开帷幕的NIPS大会之所以备受瞩目,是因为机器学习已迅速成为开发消费者和企业所需、所想、所爱的技术的不可或缺的一个工具。以机器学习为基础的技术可以做实时语音翻译(如Skype Translator)、帮助医生读取医疗影像,甚至还能识别人的面部情绪。机器学习还能帮助你把垃圾邮件从收件箱中清除出去并提醒你完成每天的任务。

著名AI研究员Robert Schapire。摄影:John Brecher

这与Schapire早年求学时代相比大相径庭。Schapire还记得,当时类似让计算机准确读取手写数字的任务已经算是难题。Schapire表示:“从最基本的问题入手,我们一点一点从头创建这个领域 。目前机器学习已经适用于大量问题了。这确实让人惊喜。”

研究人员表示,一路走来,该领域得益于那些梦想能够获得重大突破,从而让现实世界受益的人们,例如:开发像人类一样准确地识别对话中的单词的技术。微软纽约研究院的研究员Alekh Agarwal表示:“不知道为什么,机器学习领域一直非常幸运,我们拥有杰出的理论学家,他们对事物有非常实际的观点。”

普及机器学习

Schapire、Agarwal Agarwal、他们在微软纽约研究院的同事们以及世界各地的同行均认为,这只是开始。通过他们在NIPS以及其它场合展示的研究成果,他们正在研究用各种方式让机器学习能够被更多人所用、变得更加平易近人。

微软研究员表示,他们正站在普及机器学习的最前沿,要让没有机器学习背景的开发者和工程师都能更轻松地充分利用这些技术新突破。他们正努力寻求各种方式与大众分享这些系统的好处。

微软纽约研究院首席研究员John Langford表示:“机器学习历来是这样一个领域:如果你没有博士学位,你可能完全没头绪,然而即使你有了博士学位,你可能仍然毫无头绪。我们正在努力让那些没有太多机器学习专业知识的程序员也能充分利用这些技术。”

John Langford正在为普及机器学习而努力。摄影:John Brecher

机器学习之所以有用,一部分原因在于它能帮助人们对几乎任何事进行预测,从为某个任务需要部署多少台服务器到推测人们可能想要阅读哪些新闻报道无所不包。Langford最近的一个项目就是,创建能够通过应用强化学习和结构化学习而系统性消除常见数据错误的系统,进而降低多项预测的难度。

借助强化学习,研究人员希望让系统通过试错来找到完成任务的方法。例如,一个程序可能通过一遍又一遍的自我对弈学到如何在西洋双陆棋中取胜,在许多次对弈过程中分辨出有效和无效的招数。在做这些决策的过程中,该系统几乎不会获得外部指导。相反,它在初始阶段做出的决策会影响它今后如何取得成功。

强化学习对应的是监督学习,监督学习是指系统由于接收更多相关数据而得以将事情做得更好。例如,一个监督学习工具可以通过浏览一个包含大量不同面孔的训练集而学会识别照片中的面孔。

协助决策

在Langford研究的最新的强化学习方案中,该系统还能因选出部分正确的行为而得到加分,这使筛选出正确答案的过程变得更轻松。微软研究人员表示,决策服务是一个激动人心的突破,因为它能够利用上下文信息而帮助系统做出决策。

微软纽约研究院的研究员Siddhartha Sen表示:“当你做决定时,你通常已经大概知道这有多明智。现在我们有机会利用机器学习来优化这些决策。”

研究人员表示:预览版中提供的基于云的系统之所以是开创性的,部分原因是它能够应用于许多不同的情况。

例如,它可以用于想要个性化内容推荐的新闻通讯社,以及想要个性化健身活动的移动健康应用程序,或者希望优化服务器资源的云提供商。

Sen表示,测试服务的一个关键目标就是让那些可能无法自己创建这类机器学习技能的人们能够轻松方便地使用机器学习技术。

Sen表示:“普及机器学习的方式就是让它可以非常轻松地与系统对接。”Sen将在NIPS大会上主持一个题为机器学习与系统设计交集的工作坊。“我们试着隐藏所有困难的步骤。”

微软多年来一直在为诸如决策服务这样的系统开发构建块 。一直致力于该领域的研究、在微软纽约研究院进行博士后研究工作的Sarah Bird表示,该系统目前的能力甚至在几年前都是无法实现的。

Sarah Bird

Bird现在是微软Azure部门的技术顾问,她表示,这样的系统之所以快速发展,是因为机器学习所需的所有元素——云的计算能力、算法和数据——同时都在迅速发展。

她说:“看到我们所需的所有组件同时迈向成熟确实令人惊喜。无论对于消费者、开发者还是研究者来说,这都是个美好时代。”

快节奏变化

许多研究人员表示,强化学习有很远大的前景,因为它能够用来创建可做出独立和复杂决策的人工智能系统,以增强和弥补人类自身的能力。

研究人员提醒,他们仍然处于寻找强化学习成功之路的早期阶段,但是他们表示到目前为止看到的状况非常有前景。

微软剑桥研究院研究员Katja Hofmann表示:“关于究竟能达成什么目标的感觉是在不断变化的,这恰是最让我感到激动之处。” Hofmann领导了Project Malmo,该项目将游戏《我的世界》作为一个强化学习的测试场,其成果也将在NIPS上展示

最近,Hofmann与同事一起研究让人工智能代理做多项任务而不是一项任务的方式,同时把它们完成一个任务的经验运用于另一项任务。例如,运行在《我的世界》某个空间的人工智能系统可以学会识别熔岩,然后利用这一知识在另一个空间躲避其它熔岩。这一研究的部分成果也在欧洲强化学习研讨会(European Workshop on Reinforcement Learning)上展示,这一会议与NIPS同在西班牙举行。

机器学习新范式

除了上文提到的这些已有的机器学习范式之外,来自微软亚洲研究院的研究员还积极探索了其他的可能性。例如在Dual Learning for MachineTranslation这篇论文中,研究员提出了一种新的机器学习范式:对偶学习。

对偶学习的基本思想是两个对偶的任务能形成一个闭环反馈系统,使我们得以从未标注的数据上获得反馈信息,进而利用该反馈信息提高对偶任务中的两个机器学习模型。该思想具有普适性,可以扩展到多个相关任务上面,前提是只要它们能形成一个闭环反馈系统。具体内容可见《研究|对偶学习:一种新的机器学习范式》。

了解更多微软出席NIPS的信息, 请访问https://www.microsoft.com/en-us/research/event/nips-2016-microsoft-research/