分享到微博 分享到人人 分享到LinkedIn 分享到Email
从不做清华第三种人到在读女博士

——“你为什么没有攻读博士学位?”

——“因为我不想成为第三种人。”

——“?”

——“BBS上流传着一种说法,‘清华里有三种人:男人、女人和清华女博士。’我不想成为第三种人。”

我在清华读硕士的时候,老师曾经问我是否愿意转博。我当时对读博士有一些恐惧。一来,我参加过几次博士生的答辩会,发现老师们总会问工作的理论贡献是什么,我怀疑自己做不出有着高深理论的东西,无法达到博士毕业的要求;二来,在我的脑海里,女博士的典型形象往往是不修边幅、目光呆滞、不可爱的,我担心读博士之后会嫁不出去。最终,我还是决定硕士毕业。在我经过了漫长的八轮面试最终见到张宏江博士(时任副院长)的时候,就出现了上面的一番对话。我的回答把宏江逗乐了,他也许从来没有听到过这样的理由。

以前说起做研究,我首先想到的是陈景润和哥德巴赫猜想。感觉如果没有超常的聪明,能把艰深的数学理论当作家常便饭,你是做不出什么好的研究的。这也正是我怀疑自己能否达到博士水准的地方。比起我在清华里见过的无比聪明的同学,我只能算还可以,而且,我也并不能理解和喜欢数学课上的诸多内容。所幸,在研究院工作的最初一年里,我周围的同事们让我看到了做研究不一样的内涵。

研究的目的是探求真相,也是提出有价值的问题和找到解决重要问题的方法。我的研究方向是互联网搜索和挖掘。搜索技术最初产生于图书馆对检索图书的研究,而今天大量的搜索需求来自互联网。通过观察我发现,网页和电子化的图书有所不同。一个网页往往不只是单纯的一篇文章,它更像报纸,版面被划分成不同的区域。例如,在网页的顶部是网站的标志,底部有版权声明,为了方便用户到达其他页面,两侧常常是链接目录,它们以一种美观、自然的方式包裹着一篇或多篇文章。这些区域对检索来说并不是同等重要的。于是,一个有意思的问题出现了,如果我们能把重要的和辅助的区域自动分开,那将有助于一系列网络搜索和挖掘的应用。这件人很容易办到的事情对计算机来说并非易事。于是,我努力去体会和思考人是如何做到的,经过多种尝试,找到了一种自动预测网页区域重要性的方法。这篇论文发表在第十三届国际万维网会议(The International World Wide Web Conference 2004)上,并得到最佳论文的提名。这项工作对我的意义非常,它让我看到和感受到什么样的研究是能够被认可和有意义的。以前所能理解的理论研究只是科学研究的一部分,除此之外,发现一个有价值的问题、提出一个解决问题的方法都是很好的研究。

当我被微软亚洲研究院的前辈们带入科学研究的殿堂,我发现个人的力量可能是渺小的,但做研究的目的并不是让自己名垂青史,而是尽可能地发挥自己的智慧和力量,带给他人有意义、有依据的东西。我甚至发现,即使是一些失败的尝试也有发表的价值,至少别人可以知道哪些方法是行不通的,从而把时间和精力放在有希望的尝试上。科学技术正是因此而达到累积,从而在某个时刻开出让人震撼的花朵。我深深地被这种氛围所感动,现在,激励我做研究的不再是被人知晓我的名字,而是在未来某项方便人们生活的科技产品中也有我微薄的贡献。

在研究院工作之后,我也见到了许多美丽的女博士,张黔就是其中的一位。1999年,张黔博士从武汉大学毕业后来到研究院工作,2005年9月受聘为香港科技大学的副教授而离开研究院,当时她已经管理了整个无线网络组。没见到她之前,就听说她工作很拼命,研究做得很出色。见到张黔,却有点意外,她完全不是气势逼人的“铁女人”模样,而是有着轻盈、美丽的外表和自信、有趣的谈吐。有幸的是,我的老板马维英博士特别请张黔做我的生活导师[1],因此和她有一次愉快的午餐。给我印象最深的是她对平衡工作与生活的见解。她告诉我,在有了自己的房子之后她就很少加班了。她说,“如果需要天天加班,即使付双倍的工资给你,你也不会感到持久的快乐,我们需要投入地生活休闲,才可能更加有效率地工作。”这一点我在结婚之后也深有体会。缩短了工作时间,我却惊奇地发现,非但没有落下什么,反而能够做更合理的安排,先做最重要的事情,结果是收获更多。我深感工作不是全部,有滋有味的生活才是我的持久动力。

关于外表,我发现不修边幅、目光呆板只是对女性研究人员一种片面过时的印象。小时候,父母为了让我们心无旁骛会给我们一种讲究穿着和学业优秀无法共存的压力。电视剧里的女性科学工作者总是穿着朴素,带着黑边的眼镜,除了工作似乎对其他都不感兴趣,更加不擅长搭理自己的生活。但是,我们长大了,这个时代也提供给人们丰富的物质。只要不再迷信地把不修边幅当成工作认真的招牌,我们一样可以塑造出让人舒服的形象。记得有一天中午,我看到一群女实习生说说笑笑地从活动室里走出来,她们是那样有光彩,发型和衣着各具魅力,这一幕让我久久难忘。我认识其中的几个,她们是在读的博士生,很高兴她们能够比我更早地明白,美丽与女博士并无冲突。

渐渐地,我消除了对读博士的恐惧。当我能够完成一项有意思的课题,当我能够在国际研讨会上大胆讲出自己的想法,当我可以胜任组织一个团队进行一项较大规模的研究,当我的细腻给所从事的研究带来不一样的突破,当我在国际会议上宣讲论文之前在镜子前做到最好的装扮,我已经顺当地走在了做研究的路上。这里,我要衷心地感谢沈向洋博士(研究院的第三任院长),他积极地促成了上海交通大学和微软亚洲研究院的联合培养博士生项目,为我们一批喜欢做研究的硕士毕业生提供了深造的机会。现在我已经是一名在职的博士生了。

最后,我想把女科学家Karen Spärck Jones[2]的话送给所有像我一样喜欢做研究的女性们:“Computing is too important to be left for men alone。”(计算科学太重要了,已经到了不能只留给男人们来研究的地步。”

图为本文作者在参加2004年国际文本检索会议(TREC)时与Karen Spärck Jones的合影

作者介绍:

宋睿华,微软亚洲研究院互联网数据管理组研究员。2000年和2003年分别获得清华大学学士和硕士学位,2006年至今在职攻读上海交通大学博士学位。2003年加入研究院,主要从事互联网信息检索和抽取方面的研究。2004年带队参加国际信息检索评测会议TREC,获得网络搜索子评测的第二名和查询词分类子评测的第一名。她在大学期间是一名运动健儿。

[1] 生活导师是微软公司采用的一种员工互助方式。一般,担任导师的人是公司内较为资深的员工,他们通常和被指导者不在同一个部门,所指导的内容也往往不是技术上的,而是对职业发展、如何平衡工作和生活等方面提供建议。

[2] Karen Spärck Jones(1935-2007)是一名英国的计算机科学家。从1974年至2002年,她任教于剑桥大学计算机实验室。从二十世纪五十年代开始,她一直从事自然语言处理和信息检索方面的研究。她最重要贡献之一是提出在信息检索中用IDF度量词的重要性的概念,今天绝大多数的搜索引擎仍然在使用她所提出的方法。Spärck Jones教授是英国科学院院士,她获得了多项殊荣,包括信息检索界的最高奖Gerard Salton Award(1988),国际计算语言学会(ACL)终生成就奖等。她在2007年获得了由美国计算机协会主办的Allen Newell奖和ACM-W Athena演讲人奖。