分享到微博 分享到人人 分享到LinkedIn 分享到Email
微软亚洲研究院技术创新演绎新一代用户界面
作者 微软研究院
2009年6月8日

3月29日,微软亚洲研究院举行了建院以来的第七次“研究成果开放日”活动。微软研究院亚洲多通道用户界面组负责人王坚博士率团队展示了微软亚洲研究院在计算机用户界面领域的数项技术突破。其中,被美国著名技术杂志《麻省技术评论》(《MIT Technology Review》)誉为“微软魔笔”的“万能数字笔”技术得到与会者的极大关注。

在活动现场,微软亚洲研究院的研究人员拿起一支看似普通的笔,在一份现场打印出来的文件上随意修改、勾勒一番。几秒钟后,所修改的文件自动从电脑系统中被调出,出现在电脑屏幕上;更为神奇的事,打印文件上被圈点、修改的内容一丝不差的出现在电子版的文件上。

据介绍,万能数字笔的使用需要两项重要技术发明来支持。首先是文档编码技术:使电脑通过打印机打印出的文档保持为数字文档,而不是像过去那样只是一种无法读写的模拟文档。其次采用复杂的计算机视觉技术,使数字笔上的微型照相机能识别出这种特殊的打印出来的数字文档。这样计算机便能够快速确定正在操作的文档,将任何操作同步地存回到计算机中的电子文档中。

“万能数字笔”拓宽了数字计算技术的使用和处理范围,把用户从办公桌前解放出来。万能数字笔与现有的计算机和谐共存,将“模拟世界”中笔的自然、便捷和灵活与数码世界的计算能力相结合,带给你随时、随处、随意的计算体验。

微软亚洲研究院同时演示了新版“数字墨水”(Digital Ink)技术以及有趣的“基于摄像头的多通道人机交互”(Camera game)技术。在新版“数字墨水”(Digital Ink)的界面下,人们不但可以像使用现实世界的墨水一样,在平板电脑等设备上自由地进行文字及图形的手写输入,而且可在全新的数字墨水界面下进行编辑整理、共享、查找管理。数字墨水是一种与传统的文字、图片、视频及声音等不同的有结构及意义的数据类型。数字墨水技术打破了以住的手写技术主要集中于手写文字识别的禁锢,智能地对手写文档内容进行结构解析及语义理解,能够使无结构的手写笔迹组合变成有结构的手写笔记。“基于摄像头的多通道人机交互”(Party Game)技术也是微软亚洲研究院探索多通道人机交互技术的成果之一。这一技术原型主要采用了先进的计算机视觉技术,如人脸识别和追踪技术,突破了现有键盘、鼠标、游戏手柄等人机交互手段,通过数字摄像头来采撷用户的动作、分辨用户的操作意图,使人与机器的游戏过程实现的更直接、更自然、更亲切,从而拉近了人与机器的距离。同时,再次引发人们对数字摄像头在未来人机交互界面发展中可能产生作用的关注。

作为把握微软公司未来的“大脑”,成立近7年来,微软亚洲研究院始终专注于高端技术的研发与创新。目前,微软亚洲研究院主要从事于新一代多媒体、新一代用户界面、网络搜索与数字发掘、无线及网络技术、数字娱乐这五大领域的探索,并已在国际一流学术刊物和会议上发表了超过1000篇高水平的论文。 在即将召开的国际计算机视觉与模式识别大会(CVPR)上,微软亚洲研究院有17篇高水平论文被大会所采纳。再次引发人们对中国基础科研水准的强烈关注。

微软亚洲研究院院长沈向洋博士表示:“微软亚洲研究院院自成立以来,始终坚持研究成果对外开放。正是这种开放性使我们保持持续不断的生产力。通过‘研究成果开放日’的活动,我们希望提供给大众与微软亚洲研究院在基础研究领域更多的沟通交流机会”。 他同时强调:“作为一家以技术创新为发展源动力的公司,微软亚洲研究院加继续加强在亚太区与学术界、教育界交流与合作。共同推动整个亚太区基础科学的技术创新水平,共同改善和丰富未来人们的计算体验。”