分享到微博 分享到人人 分享到LinkedIn 分享到Email
跨越真实和虚拟世界的边界——走近SIGGRAPH 2014大会

作者:孙鑫

微软亚洲研究院研究员

一场大会振奋一座城

温哥华位于加拿大西海岸的不列颠哥伦比亚(British Columbia)省,传统上以工业、林业、矿业和航贸为支柱产业。大约60万的常住人口中有大量的原住民(first nations)、亚裔(包括东亚、东南亚、南亚和西亚)、拉丁美裔和非洲裔居民。优美的自然环境、交通便利的地理位置、多元化的人口组成、兴旺的经济活动以及对少数族裔和同性恋的支持和保护,使得这座城市充满着活力和吸引力。近年来温哥华扮演的更重要的角色是加拿大的信息、生物科技和电影等新兴的创新产业的核心孵化区。

由于纬度较高(和呼伦贝尔市相似),8月的温哥华气温已有所下降,旅行和度假的人数也随之减少了许多。而8月10日至14日在这里的会展中心举办的SIGGRAPH会议(计算机图形图像学大会)为这座城市带去了14,045与会人员。走在大街上很容易看到胸口挂着参会卡片的行人,经营餐馆和商店的人也都知道这个会议,在整个温哥华的市中心都能感到浓厚的会议的气氛。有意思的是我在闲逛一家首饰店的时候,一位营业员说她的儿子在艺电(Electronic Arts,EA)工作,也参加了这次会议。这些参加会议的人来自全球75个国家,有些来自工业界,有些来自学术界,有的是知名的艺术家、科 学家、工程师,也有年轻的学生、爱好者,他们活跃在图形学和人机交互的各个领域。这里有论文宣讲,专题报告,产品陈列,作品展示。这是一次内容丰富气氛火 爆的聚会,每个人都能根据自己的兴趣和喜好找到合适的活动和展览。

跨越真实和虚拟世界的边界

图形学给很多人带来的印象是美轮美奂的虚拟世界。但是真实世界和虚拟世界从未被割裂开,他们彼此之间的联系和融合会带来无穷的魅力。而其中采集制造就是连接真实和虚拟的两座桥梁。

采集是将真实世界挪放到虚拟世界的利器。我们在CG电影或者游戏中看到足以以假乱真的效果时,很有可能看到的就是来自真实世界采集得到的数据。所以每年在SIGGRAPH都能看到许多这方面的成果,不停地追求采集数据的高准确度、高复杂度,以及采集方法的高效率和便捷性。

“Reflectance Scanning: Estimating Shading Frame and BRDF with Generalized Linear Light Sources”就是一篇微软研究院发表在今年会议上关于材质采集的论文。这篇论文的工作在数据采集方法的便捷性上有很大的提升,不再像以前的方法一样需要设置复杂严格的光照条件,整个采集过程就好像扫描仪一样采用通用的线性光源的平移方式,既快速又便捷,而且不需要牺牲采集数据的质量,能保持非常高的准确度和复杂度。

 

制造则是另一座桥梁,把虚拟世界中的成果反馈作用到现实生活中。人们把自己的需求和思考输入计算机,相应的算法就能得到合适的设计和方案,并以此能制造出能够在真实世界中使用的实体。这样的制造,天生具有高度的个性化定制化,同时能优化设计,提高效率,降低成本。

近年来,3D打印无疑是其中最亮眼的主角,学术界和工业界都有很多人在关注这项技术。有的人钻研造型算法,有的人设计新型设备,也有的人在发掘合适的应用。有的人追求质量,有的人追求便捷,有的人追求艺术鉴赏。特别值得一提的是,今年的Keynote演讲的嘉宾Elliott Kotek,就介绍了他们如何使用3D打印技术帮助在战争中失去双手的Daniel设 计、制造、佩戴上义肢,帮助他两年来第一次能自主饮食。相比于传统的义肢制造,这种基于3D打印的技术由于高度个性化和高度优化,十分有效地提升了肢体障 碍人士的生活质量,并明显减少了义肢佩戴所带来的身体上的不适和疼痛。这个有爱的工作再一次体现出了虚拟技术和真实世界的互动给我们的生活所带来的改变。

高质量脸部计算方兴未艾

中国人自古有“相由心生”的说法。先不论这种说法是否有科学依据,没有人能否认人的脸部在社会活动中的重要地位。在图形学中,对于人脸的计算的研究也是少 有的、长期的热点方向。从采集、建模,到运动序列、绘制、交互,可以说每个图形学的领域和方向都有脸部计算的一席之地。近年来随着交互技术和社交文化的迅 猛发展,人脸计算的技术也持续在高性能、高质量和高交互性上渐次升温。

“Controllable High-Fidelity Facial Performance Transfer”就是一篇微软亚洲研究院发表在今年会议上关于高质量面部运动序列建模的论文。 这篇论文的技术可以将一个脸部的运动序列迁移到另一个脸部,其中的核心是高质量。由于人对于面部的敏锐观察和丰富感受,面部模型的质量对于用户体验和实际 应用具有决定性的作用。这篇文章的技术能够很好的保持住面部的起伏、褶皱等细节,不会因为面部构造的差异而降低丰富的运动效果。一个有意思的实验是把一个 人的脸部运动序列迁移到一只狗的脸部,我们还是能够感受到从狗的脸部所表达出来的同样的情绪变化,这就是得益于高质量细节的保持。值得一提的是,今年几乎 所有脸部计算的技术论文的宣讲,都实时进行了现场演示(live demo),而不是像以往一样只播放实验结果的视频。这也是对近年来脸部计算工作的可靠性和实用性的一个佐证。

 

虚拟现实技术推陈出新

虚拟现实是一个比图形学更古老的话题,也许只有在“黑客帝国(Matrix)”中才能被真正实现吧。我刚接触图形学的时候,觉得虚拟现实就是实验室中的大投影。虽然当时还懵懂无知,但是高成本和大视角确实是那个时候的技术水平的体现。时移事易,今天的虚拟现实技术革新之快,已经让人有一种山雨欲来的感觉。

平民化的3D显示也许会是引领这一轮变革的突击队。与其说Facebook用20亿美元成就了Oculus的威名,不如说平民化的Oculus Rift已经改变了人们以往对虚拟现实的看法。没有吓人的分辨率,也没有昂贵的大屏幕,但是低廉的价格和小到无法察觉的延时,使得每个人都能获得极为优秀的沉浸式体验。会场中我们可以看大许多基于Oculus Rift研发的技术和应用。他们有的只是用于传统的3D游戏,有的已经和更多元的用户体验相结合。走出会场的时候你会相信,这只是一个开始。

 

多元化的用户体验已经成为虚拟现实的发展趋势。其中声音作为人的重要感知,对于沉浸式的真实感体验是不可或缺的。以往的技术发展以视觉效果为优先。而近年 来,声音绘制已经成为和视觉绘制同样重要的热点研究问题。除了传统的高真实感的声音的仿真模拟,实时的绘制技术也已经日趋成熟。在将来,真实感不再是视觉 的独宠。

“Parametric Wave Field Coding for Precomputed Sound Propagation” 就是一篇微软研究院发表在今年会议上关于声音的实时绘制的论文。这篇论文能够计算声音在传播过程中因为物体的遮挡反弹而体现出来的波动特性。在不同的区域,不论是在室外,空旷的房间还是狭小的走道,用户都能听出声音的变化。作者采用了预计算的方法对声波响应随时间和空间的变化进行编码,因此能够在有限的存储代价下实时完成计算。

 

在每年的SIGGRAPH会议上都能看到非常新奇有趣的技术和产品。总体来说,追求高真实感和高性能是图形学永恒的主题。但是近年来人们越来越多的关注技术对人的反馈,不论是3D打印技术还是平民化的虚拟现实技 术,都折射出这样的思路。技术革新往往跟随着人们观念的变化,而年轻人的思想是最具革命性的。每年都能看到许多的年轻的学生和爱好者怀揣谦卑和好奇来参加 会议,而几年之后他们的思想和创新也许就已经改变了你我的工作和生活。而这就是技术与人的互动最具魅力的地方。

注:部分图片来源于互联网

作者简介:

孙鑫博士现为微软亚洲研究院网络图形组研究员。他分别于2008年和2002年在浙江大学获得博士和学士学位。目前主要从事计算机图形学方面的研究。

 

相关链接