分享到微博 分享到人人 分享到LinkedIn 分享到Email
往返于研究与开发之间

——微软亚洲研究院技术战略总监 张益肇

在微软亚洲研究院成立八个月之际,我带着妻儿举家来到北京开始了我研究生涯中的一个转折;2003年,在研究院成立五周年之际,我来到了由研究院孵化出的微软亚洲工程院,在一个全新的环境从事以前在微软未曾涉猎过的产品开发类工作;2008年,在研究院将要迎来它十周年生日的当儿,我又重新回到了它的怀抱,继续享受在研究过程中的乐趣。

给盖茨作报告

在1999年7月加入微软亚洲研究院的时候,我的主要工作之一就是组建语音组的研究团队,2000年我们招募了初敏加入语音组,次年又招募了Frank Seide加入,他们俩的加盟很快地就带动起了整个组在语音合成和语音搜索上的研究局面。TTS (Text to Speech, 简称TTS) 是语音组的重要项目之一,当时由初敏研究员主要负责,再加上彭煳,赵勇,赵晟,杨红云,王庆等年轻同事的全力投入,很快地作出一个中文语音合成系统。也正因为这个项目,让我经历了三年的“BillG Review”(向盖茨作报告)。

2001年,研究院第一年向盖茨汇报中文语音合成技术的成果,语音的自然度和流畅感与传统技术比起来要进步很多。盖茨听了汇报之后感觉一切都还不错,但是他摇摇头非常惋惜地说:“很可惜,我听不懂中文。”因此,盖茨对此无法給出针对性的意见,不过他仍建议我们是否可以把其他语言也做起来,2003年10月左右,浩大的Vista项目看中了我们研发的中英文语音合成引擎,并意欲转换进Vista中。那个时候正好微软亚洲工程院成立,于是语音合成项目成为了工程院成立时的最初七个项目之一。因此,那一年研究院和工程院组成的研发团队一起给盖茨集体做了一场项目汇报。当盖茨得知我们这个项目正筹划着做进微软新一代操作系统时,他急切地关心起开发流程的时间表,可见他对这个技术的早日面市是何等得期待!

随着TTS在Vista系统中的落地开花,Frank Soong博士带领着语音组为更加平滑的语音合成技术而努力着,同时一个稳定的TTS开发团队也在微软中国研发集团的成长并逐渐茁壮,当初只有四五人的项目团队如今已经发展成为二十多人,从事着除中英文之外的德文、西班牙文、法文、意大利文等其他二十几种语言的语音合成系统的开发,主要侧重于服务器上的语音交互方面的应用。让我们倍感欣慰的是,TTS技术无论是从最初的算法模型设计、原型系统建立,还是到后来的产品转化与现在更大规模的在服务器端的应用,语音合成技术的研究和开发,都是北京的研发团队自发完成的,这充分证明了中国研究团队的创造力和协作力。

盖茨说过,微软研究院的最大使命是使未来的计算机能够看、听、学,能用自然语言与人类进行交流。其实,这十年,我们都是围绕着这个愿景展开着研究,也取得了阶段性的成果,但是仍然还远未达到人工智能的程度,所以研究是一个长期的过程,需要有探索的心态,并不断拓展延伸的可能。TTS这个项目从初敏2000加入研究院开始到2006年底正式随着Vista发布,从最初的中文语音合成,接着到英文,再到后来的中英文双语合成,经历了一个较长时间的探索过程,而这种摸索和坚持都要投诸于长期的耐心。

工程的魅力

随着最后一次给盖茨做汇报的落幕,我的职业角色也从一个单纯的研究者向一名工程管理者转变,2003年底我经历了一次鲤鱼跳龙门似的跨越,微软亚洲工程院副院长的职务让我重新认识了另一种职业的魅力。

张亚勤曾经说过研究是一种气象开放、思维扩散的事业,而工程是一个不断去粗取精,直到发现非做不可的事情为止的过程。这是研究和工程所体现出来的两种不同的视野。研究和工程两者唇齿相依,研究要以实现工程转化为理想,而工程实践也离不开研究的指导,这就像中国的太极一样,虽然在工程需要有了一定的偏向,但是不能太规矩,以至于没有新的设想和新的创造进行自我完善。它们之间如何拿捏得好确实是一项很大的挑战。

无论是研究还是工程,制定明确的指标是激励自己的团队一个非常有效的方式。倘若在研究领域,我们可能用国际高水平论文的质量和数量、技术转换的多寡等重要方面去激励研究员们的学术创想,而在工程领域,我们则更多地通过参与新功能开发的数量以及对新产品发布的贡献等方面来衡量一个工程师的价值。

除了激励之外,如何在错误和失败中吸取教训也是研究和工程中都需要经常面对的一个问题,因为在这两者中,挫败是太寻常不过的家常便饭了。作为研究员或者工程师,我觉得树立长向的思维非常重要,这样能避免被一时的失败而打击。年轻时候的大起大落,从一段时间之后看来都是很小的变化,所以要用平常心对待,才能适应各种不可预知的挑战。

从我个人而言,“保持乐观的态度,做好悲观的准备”的心态,是我在工作过程中勉励并且安慰自己的一个非常实际的做法。凡事都要先给自己一个信心和动力,但是我们也要做好勇敢地面对可能出现的失败结局。