分享到微博 分享到人人 分享到LinkedIn 分享到Email
洪小文:释放语音原力 见证中国传奇
宁波位于东海之滨,是一座历史悠久的文化名城。早在七千多年前,先民们便于此地蕃息,创造了被誉为“中华远古文明之光”的河姆渡文化。春秋时,宁波名为鄞,乃越国属地。《吴越春秋》载,越有赤堇山。堇旁加邑为鄞。相传赤堇山山破出锡,若耶江干涸出铜,名师欧冶子沥血十年铸成“纯钧”。

越王勾践曾以藏剑问道于当时的“相剑者”薛烛。后者闻“纯钧”之名而色变。《越绝书》记曰:“手振拂,扬其华,淬如芙蓉始出。观其钣,烂如列星之行;观其光,浑浑如水之溢于塘。观其断,岩岩如琐石;观其才,焕焕如冰释……虽复倾城量金,珠玉竭河,犹不能得一物。”

名剑国士俱无双。

洪小文人如纯钧——深邃雍容,才华横溢,没有凌人的盛气,却保留着内敛的锋芒。而且,对这位微软亚洲研究院副院长、卡内基梅隆大学博士来说,宁波(“纯钧”传奇的衍生之地)不止是一个地理或人文词汇。它还有着一重含义:故土。

斯芬克斯的谜语

洪小文的办公室并不大。我们坐在一张小圆桌前对话。之后的两个小时里,他一直专注地凝视着与之倾谈的人。眼中流动着某种清澈的神采。

“很小的时候,我天天听父亲讲述祖国的锦绣河山。”洪小文微笑着说。他的父亲是宁波人,1950年迁至台湾省。所以,在宝岛长大的这位计算机语音学巨匠自幼便在父亲饱含深情的娓娓叙述中熟悉了宁波的风物。

建国中学是中国台北最好的中学——这所学校已有上百年历史,且历届毕业生中不乏名人,像诺贝尔奖获得者丁肇中、名作家白先勇、台北现任市长马英九等等——而洪小文则是20世纪八十年代前后建国中学最好的学生。他曾代表中国台湾与同伴一起参加了国际数学奥林匹克大赛。而在中学毕业后,他顺利考入台湾大学电机系,并于1985年获得电子工程学士学位。

洪小文决意到计算机科学最发达的国度继续深造。于是他选择了卡内基梅隆大学,师从图灵奖获得者、大名鼎鼎的罗杰•瑞迪教授。由于志趣相投、观点接近,他和一位同学很快走到了一起。经过深入思考,两个学生决定,用“自己的方法”来做语音。洪小文所说的“自己的方法”是有别于导师罗杰•瑞迪和大多数语音技术同行的“新思维”。“当时,罗杰不认同我们的研究思路。不过‘不认同’不等于‘不支持’。”

美国大学里允许异见、不盲从“权威”的学术氛围显然让这些才智非凡之士有了用武之地。罗杰•瑞迪教授的“宽容”被事实证明是积极、明智且值得尊敬的。两位华裔学生所选择的研究方向悖离了主流,其智慧成果却轰动了国际学术界,日后还被众多后继者奉为圭臬,成为他们从事语音技术研发时所因循的“主流”。

有别于传统的“专家系统”,洪小文与同学共同开发的语音识别技术完全是基于“统计和机器学习”的思路,他们将新的语音识别系统命名为“斯芬克斯”(SPHINX)。直至今日,苹果、微软及其他公司与机构的语音技术研究仍以之为基础——希腊神话里,斯芬克斯是带翅膀的狮身人面女妖,容颜美丽。她用文艺女神缪斯传授的谜语来刁难路人,最终输给了俄狄浦斯。后世,斯芬克斯逐渐成为了“谜”与“智慧”的象征。

苹果的味道

1992年,在获得了卡内基梅隆大学博士学位后,洪小文决定加盟苹果电脑公司——有趣的是,期间,卡内基梅隆大学的另一位教授里克•雷斯特(现为微软公司主管研发的高级副总裁)正在着手组建微软研究院,并向洪小文伸出了橄榄枝,但他却“有另一种想法”:“我不清楚微软对语音技术的愿景以及重视程度,对微软这个公司的了解也比较少。所以,我错过了在很早之前加入微软研究院的契机。”洪小文说——现今被一些自作多情的信息掮客吹捧为“IT业艺术家”的苹果电脑公司在1992年宣布研发新一代个人电脑、进军消费电子市场,并推出了Newton掌上电脑的原型机,发展势头似乎不错。

然而,洪小文很快发觉,苹果产品固然优秀,其市场表现却相对平庸;而且,对创新的极端追求让公司走入了一条“迎合小众”、孤芳自赏的歧途。正因如此,“那个阶段很多人对公司的前景不太乐观”。但他还是接受了苹果的任命,来到新加坡组建了一个25人研究院,专门针对中国乃至亚洲用户对语音及手写技术展开探索。成果令人兴奋——洪小文领导的研发小组成功开发出了新一代中文语音输入系统,并在1995年亚洲Comdex/ACW上荣获了“最佳软件奖”和“全场最佳奖”。《联合早报》对此评论道:“该系统在北京与公众见面时引起极大轰动……有120人参加了北京的启动仪式,出席者都是北京各主要报纸的高级编辑,以及从事电脑研究的科学家。最初他们对系统保持怀疑态度,当他们看见系统将当天的人民日报任何段落快速地输入电脑时,他们开始对系统产生兴趣……”值得一提的是,二十世纪九十年代中期的Comdex大会决不像今天这般“衰败”——“信息技术麦加”,舆论界甚至以这样的譬喻来强调其重要性。也就是说,洪小文及其团队所获奖项的分量相当重。

在微软创“纪录”

1993年,一位名叫黄学东的语音技术专家加入了微软公司的研发阵营。此人原是湖南长沙人,在清华大学修完硕士学业后,转赴英国爱丁堡大学攻读,并获得了博士学位。眼见苹果在语音识别技术领域声势迫人,负责微软语音研究的黄学东便想到了“挖人”——洪小文顺理成章地成为了他拟定的“贤士榜”上的重点人物。

首次接到微软的加盟邀请时,洪小文几乎是不假思索地拒绝了,因为那时他正负责苹果电脑公司的几个重要计划——当然,客观情况是,苹果已开始走下坡路;与之相反,微软自全球IT市场上后来居上,并在操作系统与办公软件等产品领域取得了举世瞩目的成绩;但洪小文认为,他在苹果“做得很好”,没必要更换平台。

黄学东却极其执着。他告诉洪小文,给他的工作“永远有效”,并且每隔一段时间,便会主动联络。千里马常有,伯乐不常有——更何况是这么一位认同其理念、激赏其价值的“伯乐”。终于,在黄学东屡顾茅庐之后,洪小文动心了。

1995年9月,从亚洲Comdex/ACW大展上载誉归来的洪小文一方面自觉对苹果电脑公司有了交代,一方面也为微软的诚意所打动,他终于决定,与黄学东携手作战,冀可在语音技术领域取得更大的突破。微软高度重视这位成就卓著的青年专家,并任命他做高级研究员——这是一个很高的职位。多数研究人员需要持续、专注地工作十几年,才可能升至这一位置。于是,洪小文又在微软创造了一项纪录:自获博士学位(及实际工作)之日起仅三年便跻身高级研究员行列。“这项纪录直到去年才被科特•埃克里(Kurt Akeley)打破。”洪小文半开玩笑地说——科特•埃克里是Open GL的创作者、ACM SIGGRAPH“计算机图形技术卓越成就奖”的得主,现任微软亚洲研究院高级研究员。

1995年至2005年,在微软公司,洪小文经历了三个阶段的角色嬗变,先在雷德蒙研究院从事语音技术的基础研究(研究者);后在微软的语音产品部门担任Speech.net的首席架构师(产品开发者);现今,他回到北京,在海淀区知春路希格玛大厦五层的一间办公室里继续搞研究、向周围的年轻人传授经验(导师)、协助沈向洋院长制定战略并管理研发团队(管理者)。在此期间,他还在世界一流的学术刊物与会议上发表了多篇论文,主导了若干语音技术标准的制定,出版了一部长达上千页的计算机语音学专著(《Spoken Language Processing》)——这部著作正在被世界各地的知名高校以及全球范围内的语音学研究者作为权威的教科书来使用——并参与了微软亚洲研究院的创建工作。

带伤为MSRA助阵

“我面试了微软亚洲研究院的第一批研究员。”洪小文得意地说。

多年来,洪小文一直对祖国大陆抱有一种特殊的感情,那就像是孩童对于至亲的孺慕。留学期间,他在国外接触到了很多大陆同胞——“他们都很好学,而且很亲切”。1993年,作为苹果公司的学者,他有生以来第一次踏上北京的土地,瞬息间,儿时由父亲那里得来的模糊印象变得真切而生动。洪小文回忆起当时的感觉:“非常激动!我去了紫禁城、长安街,还有天安门广场,亲身感受到了祖国的宏大气魄。”在他看来,与天安门广场相比,纽约时代广场“简直就不算广场”,台湾省的小建筑就更不用说了——“空间的格局会影响到人的格局”,在北京,洪小文目之所及,尽皆恢宏开阔,大国气度显现无遗,这似乎在昭示着国家和民族的未来。

因此,在比尔•盖茨决定将微软在亚洲唯一的研究院设立于中国北京时,洪小文和黄学东一起四处奔走、积极运筹——1998年11月5日,微软中国研究院(微软亚洲研究院的前身)的建院仪式在国际俱乐部举行,约有300位来宾见证了那个激动人心的时刻。此前,为壮大声势,美国雷德蒙微软总部的多位高层管理者及研究人员来京捧场,洪小文正是其中之一——而且,他还是带伤上阵。从美国飞往中国,正在做“多模式人机界面”研究(也即结合语音、触觉、影像等人机界面技术)的洪小文无法放下工作,只能“背着机器回北京”。不幸的是,在机场,由于“负担沉重”,他扭伤了背部,而且伤得不轻,以致一度无法站立,“只能躺着”。再加上他下榻的宾馆位于国贸,距研究院所在的希格玛大厦甚远,一些预先安排好的访问只好改以电话的形式进行。一次,在电话访问的过程中,他正在接受中医针灸、拔罐的治疗,“一边谈,一边疼得‘哎哟哎哟’。估计电话那端的人惊诧万分。”忆及往事,洪小文不禁莞尔——但即便如此,他仍旧觉得收获不小:“中医治疗真的非常有效。”这段难忘的经历让他深切感受到了祖国传统医药的“神威”。

见证中国传奇

自微软亚洲研究院创立基业至今,洪小文每年都会回中国一趟,“为研究院做点什么”。他“眼看着研究院长大”,眼看着研究院从零做起、逐渐赢得世界级声誉,眼看着研究院在各种全球顶尖的学术会议上大放异彩,眼看着研究院在技术产品化层面取得殊不逊于雷德蒙、剑桥等兄弟机构的成就……欣慰的同时,他也开始感到深深的遗憾,因为自己“毕竟不是研究院真正的一员”;也因为“无论经济还是技术”,“‘中国速度’如此迅疾”,简直像是一个“传奇”,而自己“身为炎黄子孙却从未在大陆长期生活过”。

于是,在终有机会“与微软亚洲研究院分享喜怒哀乐”时,他没有丝毫的犹疑——2004年,洪小文举家从西雅图迁到北京,而他的太太和女儿此前还从未到过中国大陆。

定居北京前,洪小文已是微软所有语音技术研发的总架构师。他对微软SAPI(Speech API)和Speech engine技术的发展作出了众所公认的卓越贡献,并多次获得类别不同的荣誉和奖励。迄今他已拥有24项美国专利(另有15项专利正在申请中),在国际最重要的会议和学术刊物上发表了90余篇论文。此外,他还是学界著名期刊《IEEE语言与音频处理汇刊》(IEEE Transaction on Speech and Audio Processing)的副主编。

洪小文既负责过基础研究,又管理过产品开发——同时,他还在多个研发领域有所涉猎。当他在微软总部领导Speech.net、自然交互服务产品部门(NISD - Natural Interactive Services Division)的产品开发时,他的实际研究领域还涵盖了自然语言处理、互联网搜索和数据采集等。在微软亚洲研究院,洪小文目前所负责的也正是上述领域的研发工作。他认为自己多年来形成的“双重视角”或许可以帮助国内的年轻学者把握到正确的方向。“研究院着重于解‘难题’,产品开发部门则每天都要面对‘真问题’。”他的意思是说,由于研究院距离产品部门、最终用户比较远,所以难免在某些时候“误将虚拟当真实”,在一些不具应用价值的项目上浪掷资源——而他恰恰在“基础研究”与“产品开发”两端均积累了一些经验,能够比较准确地判明某个项目是否值得深入探究。他还希望在北京突破以往语音技术研究的窠臼,释放语音的“原力”,从而为最终研制出“能听会讲”的智能终端提供“技术依据与实现思路”。

2005年10月,由于对微软亚洲研究院在互联网搜索技术领域狂飙突进的势头感到惊异,微软投资建立了STC(微软亚洲研究院互联网搜索技术中心),洪小文被任命为这个新机构的领导者——“STC将致力于将数据挖掘、机器学习与知识发现技术和信息分析、组织、检索与可视化的过程相结合,将目前的互联网搜索提升到一个更高的层次,同时加快技术产品化的进程,以使层出不穷的研究成果能够在第一时间为中国乃至全球的MSN Search用户所应用。”他说——在此之前,在巴西萨尔瓦多(Salvador)举行的第28届国际信息检索年会(ACM SIGGIR)上,洪小文所负责的相关课题组共发表了12篇高质量论文,数量占年会获选论文总量的15%以上,这使研究院再度蝉联了论文获选量的冠军。

洪小文坚信,回到中国继续做研究的决定是正确的。现为经济大国的中国很快会成为技术大国,这是任何国家、任何势力都难以阻挡的。作为一个中国人,洪小文期待着自己能够见证和亲验这一伟大历程。他特别提到,今日之中国遵循的是“王道”,因而在世界范围内获得了越来越多国家的尊敬。这让他感到无比的骄傲。

成功者是平常人

“成功者是平常人。”洪小文说。

有时,他会回想起20多年前。诚然,学生时代的他成绩优异——今天的他在很多人眼里也算是成功者,“但那又如何呢”?以不同的标准(例如物质财富、学术成就)去衡量,当年的许多同学比自己更成功。所以,“成功没有模式。”洪小文这样告诫国内的学生。

“社会越来越多元化,无论做哪一行,无论在哪个岗位上,我们都不应该急躁,而是要抓住每一个机会,优化我们的人生,同时把工作做到最好。”

更不应仅用一种标准来看待成功。和微软亚洲研究院的历任领导人一样,洪小文在加强学术交流、培育本土英才方面倾注了极大的心力。回国以后,仅在今年春季,他便访问了约10所高校。在此前的一次交流中,有一位国内的大学生问了他这样一个问题:在一个价值观处于剧变之中的社会大环境下,怎样才能把握自己?——而他给出的答案则是:环境不是借口。只有坚执自己认定的核心价值,才不会在惊涛骇浪中迷途。也就是说,为成功订立自己的标准,去做自己认为值得做的事——“比尔•盖茨也没有念完哈佛。如果他成天羡慕诺贝尔奖、图灵奖的获得者,那么他也肯定不会快乐。”洪小文说。

成功者也是平常人——只是比身边的其他人多了一些执着和坚忍。

现实生活中,这位名动天下的学者也很“平常”。洪小文坦承,自己是一个“传统、顾家的人”。“家庭是最重要的,”他说:“我在做任何决策时都会首先考虑家人的感受。毕竟,修身、齐家之后才能治国、平天下。”令他很开心的一件事是,在他回到北京工作之后,可以更快、更方便地回台湾省探望父母。

洪小文的嗜好颇多——旅游、高尔夫、棒球、美式足球——“但总是因为工作繁忙而难以尽兴”。他还喜欢看《星球大战》之类的科幻大片以及恐怖悬疑电影、听古典音乐和重金属摇滚乐。“我家里收藏了2000多张正版CD。”说这话时他很有点儿顾盼自豪的意思。