分享到微博 分享到人人 分享到LinkedIn 分享到Email
郭百宁博士畅谈未来图形学

本文译自微软研究院Rob Knies的文章

问:2008年是“21世纪的计算”研讨会的第十个年头,你们举办大会的目标是否已达到?

答:是的。“21世纪的计算”是亚太地区最有影响力的学术会议之一。大会致力于启发青年学生以及学者,激发他们对计算学科的兴趣,从这个意义上讲,取得了令人瞩目的成功。

大会最吸引人的莫过于我们的会议演讲者。他们的演讲富有远见,展望了计算科学的未来。这让会议的参加者们获益良多。目前,大会的影响力已经扩展到了整个亚太地区。

但我们的大会也在不断求新求变,因为中国在不停的发展。我们将继续举办这样的学术研讨会,形式可能会有所改变,但我们的目标不会变,就是将亚太地区的学术界与西方的学术界联系起来,创造一个双方对话、交流与合作的平台。

问:您在计算机图形学领域享有盛名,那么您是怎样对这个领域开始有产生兴趣的呢? 答:我本科就读于北京大学数学系,随后在康奈尔,师从图灵奖获得者John Hopcroft继续攻读数学博士学位。John是一位理论家,但他也时刻关注将理论用于解决实际需求的问题。我和他在这一点上很像,因此我们很合得来。当时我还没有从事主流的图形学研究,而是在做集合建模,几何是我的研究方向。

以前学习几何,主要是进行抽象思维,依靠想象在思维中绘制图形,现在借助于计算机,我们能迅速浏览每个平面,并难以置信地看到面 与面之间是怎么组合的。

这之后,我去了多伦多大学,这一去就是三年。在这令人激动的三年中,我和Demetri Terzopoulos一起工作,而Demetri是沈向洋(微软亚洲研究院前院长,现微软全球副总裁)的导师。就是在那里,我开始了图形学的研究。

关于科学研究有个老套的说法:在进入一个新领域的时候,人们会这样告诉自己,“好吧,我把这个问题解决了,就回到以前的研究领域。”但事实并非如此。在你进入到一个新领,解决了一个问题之后,往往会遇到接踵而来的更多问题,你就很容易被吸引到了一个更广的研究领域。对我来说,从数学转到图形学,我从没后悔过。

问:自从您专注于图形学研究以来,取得了哪些最令您骄傲的成果?

答:我们在外观建模方面取得了一些成果。研究者希望通过更好的计算阴影,来让图形传递更多的真实细节。传统计算阴影的方法叫做高洛得明暗法(Gourand Shading),这种方法计算的是散点以及散点之间的线性差值。这种方法在实施计算的图形中的应用一直让人很满意。

自从视频处理器(GPU)出现以后,这种情况有所变化。视频处理器中的像素着色器能够计算屏幕上的每一个像素单元的颜色。像素着色器作为硬件,能高速的实现实时计算。问题在于,虽然你能为每一个像素编写程序,但还缺少一个计算的原则:光线如何打到一个表面上?进入表面后,光线是散射开来,还是直接被反射。这些光学原理在物理学中已经被研究得很清楚了,但他们如何应用到图形渲染(图形绘制)中呢?

在这个研究领域中,我们做了很多工作,并且积极的参加最著名的图形学会议SIGGRAPH(国际图形学大会)。

说起怎么对外观建模感兴趣,那还得要回到1999年的夏天,我去伯克利参加了由三位知名教授:斯坦福的Pat Hanrahan,伯克利的Jitendra Malik以及荷兰Utrecht大学的Jan Koenderink组织的一个小型学术研讨会。那次会议上,我意识到了外观建模的重要性。也是在那次会议上,我从Malik的小组了解到了3-D Texton技术。当年的晚些时候,我加入了微软中国研究院(现更名为微软亚洲研究院)。2001年,我应用3-D Texton技术原则解决了在普通表面合成双向纹理的问题。2002年,这项研究成果被发表在SIGGRAPH会议上。自那以后,我们就一直从事这个领域的研究,因为尽管我们有了很多的科学发现,但根本的问题还没有解决。我想,在这个研究领域中,我们研究小组是处于世界领先地位的。

一直以来,我们致力于将这些研究成果转化到产品中去。近几年,我们跟开发了Halo系列的Bungie Studio建立了战略合作伙伴关系。Bungie是一群勇于挑战的人,他们不断为自己设置更高的标准。他们推出的Halo很有影响力,掀起了一股新的游戏潮流。每次Halo发布新的版本,Bungie小组都希望其成为视觉效果方面的新标准。因此,Bungie小组对我们的研究成果非常感兴趣。我们的技术能被应用到这么一个顶级的游戏中,我们当然也非常开心。这次合作对我们双方而言都是双赢的。

从Halo2开始,我们就与Bungie合作技术转移。但在开始阶段,更多合作意味着建立彼此的信任。比如说,我们有一项水渲染技术。这项技术早已被转化到Xbox开发工具包(XDK)中了,任何人只要有Xbox开发工具包,就能看到源代码。但我们仍然做了大量的工作才让Bungie小组的人搞明白如何将这项技术应用到他们的游戏中。有意思的是,他们弄明白这项技术之后,非常感兴趣,并且把这项水渲染技术应用到了游戏的各个地方。Halo3的时候,我们彼此之间已经建立起了一定的信任,在策划Halo3的阶段,Bungie小组就计划采用我们的最新技术作为游戏中光照和物质材料单元的引擎。这些技术包括:为通用场景生成纹理图的UVAtlas技术;在合理的数据量下,在物体表面产生全局光照效果的光照映射压缩(lightmap compression)技术;对双向的反射分布函数快速渲染,从而使物体的外观从各个角度看都显得更加真实的技术。同时,我们还改进了水渲染技术。这项水渲染技术让你能随时模拟河流以及小溪并且能实现与水流交互的效果。比如,你能看到跳进水里产生的水花。Bungie在Halo3里应用了我们的大量技术,这些技术已经成为这款游戏的基石。

问:你们小组还做了哪些关键的项目?

答:我们的工作都是围绕视频处理器(GPU)开展的。我想,一个研究小组应该专注于自己的研究领域,这和商业有些相像。当然,专注并不意味着不能多样化,但至少应该致力于相关度比较高的领域。

例如,我们在虚拟视频处理器(GPU)领域做了很多工作,这是一项很重要的技术,并且我们是公司唯一一个会模拟GPU的研究组。这是很有意义的, 因为一旦GPU变得更重要,我们对于这一领域的投入就可以带来更大的收益。

另一个关于GPU的项目是GPU编程。一些工业企业正在推动GPU来用于通用计算。GPU的能力不仅仅局限于图形,它可以被应用于通用计算及其相关领域。

其他的公司倾向于使用强大的多核CPU并行处理器。在这种情况下,你只能用CPU内核来取代一些过去使用GPU来做的事情。

而我们的立场是,最好的计算机是在一个多核CPU上捆绑了许多GPU。你可以让一个CPU像一个GPU那样运行,可是会有成本问题,GPU的成本比较低。但是它的可编程性有所局限,所以我们一直在研究如何让整个集成系统的程序更加简单。在今年的计算机图形学大会(SIGGRAPH)上, 我们带来了一种全新的程序语言,BSGP, Bulk-Synchronous 的GPU程序语言。从前,你不得不编写像程序集那样复杂的语言而现在只需要写像C语言一样的语言来进行GPU编程。这样既便于阅读,又便于编写,而且维护也很简单。这门语言在图形学界获得了很好的回应。我们把代码上传到网上就有很多人下载它。因为这门语言编译器设计的很好,我们不会损失一点性能。

我们的最终目标是能够为拥有多核CPU和很多GPU的集成系统提供最好的技术。我们希望能开发一门程序语言, 一个系统和一些程序调整工具来让尽可能的使编写程序变得简单。

问:您在微软研究院的职业生涯是如何开始的?

答:我当时还在英特尔工作,由于认识沈向洋(Harry),他为我提供了一个来北京的好机会。“你去那里两三年,如果不适合,你可以再回来”,他说:“如果我们很成功,那么我们每年都可以在SIGGRAPH发表一篇论文”。那时,对于图形学研究员来讲,这可是一个相当远大的目标。因为这个领域的竞争相当激烈。

我觉得这一点很吸引我,所以我就来了。Harry当时是视觉计算组的经理,而我是这个组的研究员。我们的队伍不断发展壮大。到2001年,Harry提议说:“去组建一个图形学研究组吧。”于是我们马上付诸实施。我开创并管理起了这个新生的网络图形组,也就是从那时起,我开始从事管理工作。

在2003年,我升为首席研究员。2005年由于Harry被提升为研究院院长,我便开始接替Harry担任视觉计算组代理经理。到了2007年,当Harry任职为微软全球副总裁后,洪小文接替Harry升为微软亚洲研究院院长,我则委以研究院常务副院长的重任,同时管理网络图形组、视觉计算组和网络多媒体组。这些研究组的实力都很强。我还创建了理论组和另一个叫作多媒体通信的研究组,同时从事多媒体、系统和网络多方面的研究。

问:洪小文院长提到过他钦佩你承担大赌注的能力。做事很有决心,看不到结果不肯罢休。你同意这个评价么?

答:洪小文总是这样过于夸奖我。我想我是很有耐心,但是我并不是只是站在那里等待。我还是毫不犹豫的坚持推进基本现状。比如说,我们开始了GPU编程这个新的领域,推动了这个领域的发展。我们希望在这个领域能成为世界的领先者。在每一个我们研究的领域,我们都想成为一个领导者。

问:你们刚刚庆祝过微软亚洲研究院成立10周年。你对互联网图形学下一个十年的展望是什么样的?

答:我希望我们能够有非常大的发展。计算机世界会发生巨大的改变。在研究方面,如果不是在下一个10年就是在下一个20年,会出现一个重大的转折点。

多学科将会是未来发展趋势。我们越来越希望能与其他学科合作。我们希望鼓励多学科人才共同投入到基础研究中,寻求实现根本性突破,而不必去担心失败。

最令人骄傲的一件事就是我们的研究队伍在不断壮大。在下一个十年,我想我们的重点不是关心人数的增加,而是关注研究员素质的提高。从现在来看微软亚洲研究院,这里大多数都是较为年轻的初级研究员。再过十年,就不会是这样了,会有越来越多的资深研究员成长起来,成为其领域内世界一流的专家。