分享到微博 分享到人人 分享到LinkedIn 分享到Email
刘铁岩:在微软大学的三次华丽转型

一个理想的研究人员成长轨迹应该是什么样的?

微软全球执行副总裁沈向洋博士认为一个酷酷的研究员应该是这样的:“挑选一个雄心勃勃的目标,致力于端到端的研究,长久的坚持,而他的研究伙伴们也应该有着同样的激情,但最重要的是始终乐在其中。”

如果以这个标准来看,微软亚洲研究院首席研究员刘铁岩博士可谓是研究员的范本。2003年,从清华大学电子工程系博士毕业之后,刘铁岩直接进入了微软亚洲研究院,在这一待就是十余年。这十多年间,刘铁岩博士由原本的多媒体信号处理方向的博士,逐步成长为国际机器学习和信息检索领域的知名学者。这些转型在外人看起来十分巨大,但“三清”(本科、硕士和博士都就读于清华大学)出身的刘铁岩博士说:“微软亚洲研究院其实是我的第二所大学,这是一个培养人的地方,有了她的帮助,这一切其实过渡地非常自然。”

开放环境带来的首次转型

在结束了九年的清华校园学习时,摆在刘铁岩面前的选择有很多,例如知名大学教职等等,而微软亚洲研究院吸引刘铁岩的除了全球领先的研究环境之外,更重要的是可以和自己敬仰已久的顶尖行业大牛一起工作,对于一个刚开始入行的年轻研究员来说无疑动力巨大。因此,刘铁岩于2003年正式加入了微软亚洲研究院,并由原来的多媒体信号处理方向的研究转入了互联网搜索与挖掘领域,从此开始了对信息检索这一全新领域的探索。

这是刘铁岩在研究院的第一次转型,但这次转型并不像人们想象的那么艰难,因为微软亚洲研究院为研究人员提供了一个十分开放的科研环境,让研究员们有充分的自由和资源来调整自己的研究兴趣。在这里刘铁岩和很多不同研究方向的资深研究员们进行了交流,其中包括他后来的老板,现在的微软亚洲研究院常务副院长马维英博士。同时,借助研究院这个平台刘铁岩还与众多国际知名学者进行了深入交流,进一步拓宽了其科研视野,刘铁岩博士首次转型的领路人便是卡内基梅隆大学的文本分类领域的资深专家杨颐明授。2004年暑假,正处于转型期的刘铁岩博士遇见了前来微软亚洲研究院交流的杨教授,便一拍即合地展开了合作。他们当时共同搭建了当时世界上最大的、近三十万类的文本分类系统,相关论文收到了广泛关注,短短几年间就被引用了数百次。这次和杨教授的合作也成了刘铁岩进入到文本信息处理领域的第一个敲门砖。从那个时候起,刘铁岩开始了解什么是信息检索,什么是文本分类系统,他的首次转型也逐步成型。

挑选一个雄心勃勃的目标:排序学习

第一次转型之后,刘铁岩作为信息检索领域的新人,始终保持着旺盛的好奇心,不断思考着能为这个领域带来哪些新东西。当时围绕搜索引擎所开展的研究十分火热,信息检索更是人们关注的重中之重。通过大量的文献研究,刘铁岩发现这个方向大多数的研究者都是数字图书馆专业背景,因此研究方法都偏向经验化,缺少了对于优化系统方式和目标的科学思考。

基于对行业的洞察,刘铁岩开始深入学习机器学习的相关知识,并试图把机器学习的思想引入信息检索领域。由此,刘铁岩博士在学术界的第一个成名工作——排序学习(learning to rank)就这样诞生了,该方法为信息检索领域带来了重大变革。

随后,刘铁岩的研究便围绕排序学习展开。在2007到2008年,刘铁岩和他的团队在SIGIR、WWW、ICML等顶级学术会议上发表了大量的关于排序学习的论文,还在主流会议上做主题讲座、主持专题研讨会。他的表现受到了学术界越来越多的关注,更多的研究人员跟随他进入到这个领域中来,短短的几年时间刘铁岩及其团队的研究实力便在全世界的信息检索领域内遥遥领先。而刘铁岩博士出的第一本学术专著也与排序学习相关。该专著已被多所大学作为教科书、并被其他学者引用了近千次。

致力于端到端的系统性研究

在2008年到2009年左右,排序学习领域尽管很繁荣,但是多数人仍把排序学习作为应用级的研究。在机器学习领域的主流学术会议中,排序学习通常也会被分到应用领域(application track)。

刘铁岩很快就发现了这其中的原因:一个研究领域如果缺少科研理论的话,是无法被广泛认可的。因此在后来的几年时间里,刘铁岩和他的研究团队花费了大量时间从理论的角度把排序学习领域正式化,去阐述这个领域是什么、目标是什么、各种算法的关系是什么、有什么样的理论性质等等。他们在ICML、NIPS、COLT等顶级机器学习会议上发表了大量排序学习的理论文章,即使到今天这些论文的影响力也十分深刻。在这整个的研究周期内,刘铁岩及其团队把排序学习打造成一个完整的研究领域,并通过从算法到理论的一系列研究成果,让这个领域真正的火了起来,刘铁岩也成了这一研究领域当之无愧的代表人物。

这就是微软亚洲研究院里一个典型的研究案例。刘铁岩在微软内部的导师Rakesh Agrawal院士曾告诉他:“对于研究人员来说,并不是为了发表论文而发论文,而是要在特定的历史阶段,针对一个重要的问题,从表面到核心全部做到位。”一直到今天,排序学习一直都是很多会议的主要方向之一,仍然有很多学者在进行研究。正是因为这些工作,刘铁岩博士完成了他的第二次转型—— 由信息检索转变到了机器学习。

第三次转型:博弈机器学习



图片来源于网络

在微软亚洲研究院,研究员的研究成果除了作为论文发表出来之外,还会应用到微软的各个产品中。通过与产品部门合作,研究员们可以发现实际应用中的新问题。刘铁岩团队与微软的在线广告部门的合作就是其中一个非常有代表性的实例。

这项合作始于排序学习,刘铁岩和团队成员帮微软广告部门离线训练了一个效果极佳的机器学习模型用于必应广告搜索中的竞价排名。上线之初模型立刻带来了很大的效益,但随着时间的推移,广告效益却大打折扣。刘铁岩和他的团队发现了这个问题,并找到了奇怪现象的根源:广告竞价排名过程常常涉及到人(广告主)的因素,广告主会因为算法的改变带来的价格变化,敏锐地调整自己的广告投放策略,这是一个动态过程。如果不考虑经济规律和人的动态策略,离线地进行机器学习模型的训练,结果自然会产生很大的偏差。

如果想把广告竞价这个动态问题解释清楚,仅有机器学习的知识背景显然是不够的。所以刘铁岩便带领其团队开始学习博弈论,计算经济学等等,组名也改成了“互联网经济研究组”,这便是他第三次转型的开始。在这个转型过程中,他发明了一种全新的技术,称为“博弈机器学习”,把博弈论的思想引入到机器学习的过程中,来对人的动态策略进行建模,从而解决上文提到的难题。

如果你了解博弈论和机器学习分别是什么的话,就会发现这两个领域差别巨大,完全是不同的体系,那么这次转型的难度也可想而知。刘铁岩博士说: “对于任何一位研究人员,如果不是在微软亚洲研究院的话,这种转型都是非常困难的。因为,如果你开始学习新东西,想要有这个领域的人认识、认可你,并产生顶级的影响力是十分艰难的。但当我们真正去做的时候,发现微软亚洲研究院给了我们很多帮助,这让我们对新领域的研究变得轻松不少。”当刘铁岩和他们组的研究员们开始涉足互联网经济领域时,不仅有来自微软其他研究院在博弈论领域颇有建树的同事(如Noam Nisan)的帮助、也有很多来自学界的博弈论专家(如邓小铁教授、叶荫宇教授等)抛出了橄榄枝。他们互相访问,一起参加各种学术活动,互相交流,在很短的时间内,刘铁岩他们就对博弈论这一研究方向有了很多深刻的认识:不仅在算法博弈论领域的顶级会议上发表了多篇论文,还在互联网经济研究组成立不到两年的时间里,以程序委员会主席的身份把全世界第二的算法博弈论会议——互联网经济大会(WINE)带到中国。

黄金三镖客:电子,数学和计算机



微软亚洲研究院人工智能组

三次转型,成就了刘铁岩博士一路创新不断的探索和发现,然而这背后也离不开其整个研究团队的支持与努力。现在,刘铁岩博士带领的团队更名为“人工智能组”,继续在当下火热的机器学习和人工智能领域进行深耕。不久前,微软亚洲研究院对外开源的DMTK(分布式机器学习工具包)便是这个小组的研究成果。

如果给这个研究组寻找一个关键词的话,那一定是“求知欲”。从刘铁岩的三次转型中也不难发现,现名为人工智能组的研究员们绝非循规蹈矩之人,他们有着强烈的求知欲,就像初生牛犊不怕虎一样,知难而进,什么不会学什么,什么难做什么,朝气十足。

而另一方面,该团队的组合十分有趣,就像微软亚洲研究院的一个小小缩影一样。研究员们的专业覆盖面既不是全部精钻于机器学习,也不是全部埋头在博弈论上。目前,人工智能组有三分之一的研究员出自数学系,专业包括计算数学、概率论和组合数学,这涵盖了该团队所需要的所有数学基础。另外三分之一的研究员,包括刘铁岩在内都是来自电子工程专业,刘铁岩博士认为,电子工程专业出身的人有一个很大的优点便是有着非常好的直觉,并且不局限自己的思路,十分开放。而其余三分之一的研究员则是计算机专业出身,他们都拥有很强的计算机技能。当数学、电子和计算机三拨精英碰撞在一起的时候,就没有什么研究方向能难得住他们了。

此外,人工智能组还是一个十分重视学术和工程实践相结合的团队。他们的很多启发与灵感都来自于与微软产品部门的合作,因此,这是一个不断提出新问题的团队。在人工智能组发表的论文中你可以看到一个很明显的特点:团队很少循规蹈矩地解决别人提出的问题,而是经常提出新的问题,并给出一个力所能及范围内的最优解。这样的论文常常有很高的引用数,平均下来,刘铁岩和他的团队发表的论文几乎每篇都有上百次的引用。

三次转型带来了如今人工智能研究组的团队凝聚力。一加一大于二,小组的很多论文都有至少一个电子,一个计算机和一个数学背景的研究员参与,这样的论文都非常有特点,也能满足各种要求,无论是定力证明、直觉、还是实现的精巧,都可圈可点。

“争吵文化”与“真理不辨不明”

刘铁岩博士带领的人工智能组还有一个十分有趣的“争吵文化”。在接受采访时,笔者对刘铁岩博士嘴里说出的“争吵文化”感到十分难以置信。坐在对面的刘铁岩博士穿着经典款的男士衬衫,外套一件淡灰色的羊毛开衫,学院气息浓厚,让人似乎很难将他与“争吵”联系在一起。

“我们团队几乎会天天争吵。”刘铁岩博士笑言。但这其实是研究组最有活力的状态,开会的时候,大家不会在乎职位高低,就一个问题会针锋相对地表达自己的观点。人工智能组全组上下都坚持的一个信条是“真理不辨不明”。在刘铁岩的带领下,整个组会相互批判的看问题,就连待久一点的实习生也会自然的融入其中,和他的导师间也是一种互相辩论,互相学习的关系。

因此,对于实习生来说,进入微软亚洲研究院会带来巨大的成长。首先是知识的积累,很多实习生在进研究院之初知识非常有限。但微软亚洲研究院计算机专家资源密集,超过两百名的计算机专家们的研究经历、方向和视角各不相同,向他们学习一定会有所收获。其次,实习生们在这里学会的更多是研究经验和研究方法,“争吵文化”在这里便得到了很好的体现。无论是什么大牛发了什么论文,都应该抱有一种“破坏性”的思想,先客观地分析,从中立甚至批判的视角来研究。因此,人工智能组培养出的实习生也都个性十足,颇有“小牛”风范,从不盲目崇拜。

在微软亚洲研究院大学:成长于中国,却能影响世界

作为三清毕业的博士、微软亚洲研究院首席研究员,刘铁岩博士的研究之路始终都未离开中国本土。而作为国际机器学习和信息检索领域的知名学者,他的国际影响力也毋庸置疑。刘铁岩的论文多次获得最佳论文奖、最高引用论文奖;他担任了SIGIR、WWW、NIPS、AAAI等众多顶级学术会议的程序委员会主席或领域主席,ACM信息系统会刊(TOIS)、ACM万维网会刊(TWEB)等主流学术期刊的副主编;他和他的研究成果也被美国国家公共电台、中国中央电视台、MIT技术评论等国内外知名媒体所报道。此外,他还受邀在包括卡内基梅隆大学(CMU)、诺丁汉大学在内的国内外知名高校担任客座教授、博士生导师。对于所获得的诸多成就,刘铁岩无不感动地说:“最重要的原因其实是我来自微软亚洲研究院,如果我博士毕业没有来到研究院,我都不敢想象会有今天的影响力。”

微软亚洲研究院从1998年11月成立的第一天开始,就在国际学术界扮演着举足轻重的作用。这么多年来,研究院以一贯开放的心态,与学术界展开积极的合作,而研究院开放的学术环境也为研究人员们构建了一座与学术界的桥梁,两者相辅相成。甚至有国外学者戏称微软亚洲研究院是一个让人“又爱又恨”的机构。爱在它的研究成果,为学术界带来了诸多创新,也“恨”在其彪悍的实力,让别人望尘莫及。

除了学术合作,微软亚洲研究院为研究员们还提供了接触用户,服务用户的可能。微软亚洲研究院的研究员也和微软的产品部分积极展开合作。刘铁岩博士带领的人工智能组的技术转化也体现在微软必应搜索的搜索结果排序和广告排序,小冰的自动问答技术等微软的产品和服务中。

刘铁岩博士谦虚的表示,“能成为包括CMU在内的众多知名高校的客座教授,很大程度源于学术界对微软亚洲研究院的信任。甚至人工智能组的实习生,也成为了CMU的offer收割机,这都得益于我们开放的科研环境和紧密的学术交流。因为微软亚洲研究院,我们的研究被更多人关注,我们的新人也被更多人认可,这就形成了一个良性循环。类似于国外的师承关系,从这个角度来看,微软亚洲研究院着实就像是一所大学了。”