分享到微博 分享到人人 分享到LinkedIn 分享到Email
精诚合作,携手并进——记哈工大语言语音教育部-微软重点实验室

历史悠久的哈尔滨工业大学(以下简称哈工大)坐落在冰城哈尔滨这座中国最北的繁华都市,整个大学犹如松柏——耐得住寒冷,低调而踏实。在保留着浓郁苏联风格的教学主楼里,哈工大学子秉承校训“规格严格,功夫到家”,一丝不苟,严谨学术,默默地为中国科研事业的发展做出巨大贡献。

微软亚洲研究院自成立以来就和这座科研风格务实的大学有着不解情缘。连接微软亚洲研究院和哈工大的最重要载体,就是哈工大语言语音教育部-微软重点实验室(以下简称“哈工大-微软联合实验室”)。十六年来,实验室通过策划一系列科研项目、创办全国性暑期学校和博士生联合培养计划,将自然语言处理相关的科研成果分享给各界,并向业界和学界输送了大批优秀人才。实验室的成长与成功,是微软亚洲研究院与哈工大精诚合作的共同成果。我们在微软亚洲研究院自然语言计算组首席研究员、实验室创始人之一、哈工大校友周明博士的帮助下,一同回顾了哈工大-微软联合实验室的点滴故事。

微软亚洲研究院自然语言计算组首席研究员、实验室创始人之一、哈工大校友周明博士与我们一同回顾哈工大-微软联合实验室的故事

合作伊始:联合实验室成立

作为实验室的创始人之一的周明,现任微软亚洲研究院自然语言计算组首席研究员,他是哈工大的校友。据他介绍,微软亚洲研究院在1998年11月成立之始,就有了与中国各大高校共同建立联合实验室的设想。哈工大的师生在业界享有“作风朴实,有实干的精神”的良好口碑,拥有研发大系统的经验,且在自然语言领域拥有良好的研究基础,这些优势都能使哈工大成为微软的良好伙伴。很快,周明就找到了他的导师、哈工大校党委书记李生教授,协商合作意向。

在周明的印象中,整个协商过程可以用“一拍即合”来形容。李老师对微软方面的合作计划,包括项目合作、人才培养和资源互惠等十分认可,并在准备阶段提供了大力的支持。2000年,哈工大-微软联合实验室成立,以自然语言和机器翻译为主要研究方向。

2004年,微软亚洲研究院迎来了一位当时新上任的常务副院长——洪小文博士(现任微软亚太研发集团主席、兼微软亚洲研究院的院长)。洪小文博士是微软杰出科学家及国际公认的语音识别专家,在语音领域享有极高的声誉及权威。此时,周明正计划将联合实验室的研究领域,从机器翻译和自然语言处理扩展到语音处理领域。刚刚上任的洪小文对科研合作具有极高的热情,他的到来给周明增添了极大的助力——在小文刚刚回国的第二天,就在周明陪同下到哈工大进行访问。该年,实验室相继更名为哈工大-微软自然语言处理及语音技术联合实验室、及哈工大-微软语言语音联合实验室,并成功升级为中国教育部认可的“重点实验室”。

2004年,哈工大-微软联合实验室聘请洪小文为哈工大客座教授

图中,小文左侧为时任哈尔滨工业大学书记李生教授;右侧为时任微软亚洲研究院院长、现任微软全球执行副总裁沈向洋博士。

人才培养:惠及学子

随着微软与哈工大的合作不断深入,联合实验室为越来越多的学生带来了资源和平台上的福利,也为尖端人才的培养带来了便利。其中,暑期学校项目和联合博士生培养项目获得了尤为突出的成效。

为了能够吸引更多青年才俊加入到语言语音领域研究,实验室借鉴约翰霍普金斯暑期学校的模式,把先前已成功举办的微软自然语言处理暑期学校升级为哈工大-微软联合实验室暑期学校项目。每年暑期邀请国际知名的技术专家到哈工大开展专题技术研讨会,会后学生将学以致用上机实训,真正地参与到一个项目或工程中去。

2005年,第一届暑期学校顺利开办,主题是信息抽取。周明邀请了微软亚洲研究院研究员牛成博士、Frank Seide博士、新加坡国立大学教授黄伟道博士、时任美国南加州大学研究员、后来加入微软亚洲研究院的林钦佑博士等国际知名学者到哈工大演讲。学生们听完讲座之后,需围绕预设的主题,完成一个项目或工程,然后口头发表或者答辩之后才算顺利完成在暑期学校的学业。首届暑期学校吸引了200余名来自全国各地高校和研究院的学员参与。

2005年,首届暑期学校顺利开办

其后,暑期学校逐步在哈尔滨、深圳、威海等地开办,均依托哈工大的各地校园并得到当地政府的大力支持。最终发展成为全国性的学术交流项目,自2013年开始,有中文信息学会主办。截止去年,暑期学校研讨会已累积吸引了2000余名参会者,其中很多人成为本领域的骨干和领军人物,活跃在著名的学校和公司不少地方政府对联合实验室把先进技术带到当地的学校及企业,启发当地学生的做法表示了感谢与支持。

如果说暑期学校从广度上惠及了全国学子,那么,自2006年起,微软与哈工大推出的联合培养博士生项目(以下简称“博士生联培”),则在深度上促进了尖端人才的培养。作为联合实验室人才培养计划的重要一环,博士生联培为学生提供了在微软亚洲研究院长期实习的机会,并配备业内的导师进行一对一的项目研究指导,有别于学校里更偏向理论的研究方向,博士生联培让学生接触并自发进行更加务实的研究项目。

刘璟是哈工大和微软联合培养博士的一员,并由微软亚洲研究院院长洪小文亲自担任导师。五年读博期间,刘璟常驻微软亚洲研究院实习。2014年毕业后,他正式加入微软亚洲研究院,成为一名研究员。

回顾他在联合实验室中的日子,他认为自己获得的最大财富,是一种跨领域的视野。“联合实验室里有计算机科学家、统计学家、设计师等,他们许多富有创意的想法也给我带来新的挑战。”他尤其感激他在微软亚洲研究院的指导研究员林钦佑。“在过去的五年中,林钦佑每周都抽空跟我进行一对一的交流,从未间断。在此期间,我在高端学会上共发表了9篇论文,我所参与的研究项目也获得了两项美国专利。然而最重要的是,在联合实验室的经历教会了我如何做好研究。”

除此之外,联合实验室正在寻求为学员提供国际交换的机会,从资源上鼓励并支持他们参与到国际学术会议中去,从而实现人才的国际化。

架起桥梁:沟通学界与业界

十五年间,联合实验室已逐步在学界和业界架起了一座桥梁。通过双方的合作和努力,实验室成功将业内资深研究员引入大学校园担任导师,并鼓励学生进入业内参与实践,促进了学界和业界的人才对流。从实验室的科研成果来看,有着理论性和实践性并重的特点,大力推动学界理论研究与业界应用研究的交流对接。

至今,已有五位微软亚洲研究院资深研究员被聘为哈工大兼职博士生导师,包括院长洪小文博士,常务副院长赵峰博士、常务副院长马维英博士,自然语言计算组首席研究员周明博士,和语音组首席研究员宋謌平博士。

2008年,微软亚洲研究院常务副院长马维英博士访问联合实验室,进行了关于进一步合作的讨论

同时,联合实验室也向微软亚洲研究院输送了约三百名实习生。这些实习经历为学生开展科研和就业选择提供了难得的参考和启发。截至今年,博士生联合培养计划已经累积招收17名学员,其中有7名已经获得了博士学位,有5人在毕业后进入微软成为研究员。而随着“青年教师铸星计划”的建立,数批青年访问学者前往微软亚洲研究院参与实践锻炼,并最终回到哈工大发光发热。

除人才对流外,联合实验室的科研成果也表现出了理论思维与实践思维的相结合。自2004年,联合实验室的研究员已经发表了超过500篇期刊论文,在ACL, SIGIR等国际著名会议等发表了30篇论文。许多技术被运用到多语言机器翻译的项目中。其中,英语-汉语-维吾尔语语言机器翻译项目已取得了大量成果,研发出的自动翻译软件可以实现英中维互译。该项目的主要负责人朱聪慧曾是联合实验室的第一批学生。获得博士学位后,他成为了哈工大的教师,并继续活跃在联合实验室中。在他看来,项目的成功和与微软亚洲研究院的长期合作密不可分。“Microsoft Translator Hub这一平台使少数民族语言的机器翻译成为可能,并使相关的科研成果具有很好的延展性。维吾尔语的机器翻译是一个好的开端,下一步将会扩充到更多语言,努力消除在中国甚至跨国的语言屏障。”

展望未来:大合作促双赢

联合实验室的长足发展得益于双方长期以来的共同努力。在哈工大李生老师、徐晓飞老师以及微软研究院历届院长的支持下,双方秉持着精诚合作的态度,并保持沟通交流,使许多项目得以落实,且快速发展。

2014年,李生教授参加微软亚洲教育峰会

首先,得益于汉维互译系统的开发,相应的工作原理和Translator Hub将会在不久的未来,实现其他少数民族语言与汉语的互译。同时,鉴于微软Skype Translator预览版技术的发展与语言种类的增加,未来,周明认为,此项目可以延伸到少数民族语言甚至是方言。可见,微软和哈工大在语音翻译、Skype Translator、在线翻译上有着广阔的合作前景。

哈工大联合实验室虽然起源于机器翻译,但是也致力于在很多新的领域拓展,例如语音处理和社交网络。哈工大刘挺教授新成立的社会媒体实验室,已在一系列研究课题上有所收获,包括社会媒体文本挖掘、传播模式、大数据处理、即时新闻挖掘、趋势的发现等。双方在这个新领域也开展了学生培养方面的合作。譬如最近唐都钰同学在微软实习期间,深入研究了深度学习在情感计算的应用,发表了多篇国际顶级会议的论文。

作为一座桥梁,联合实验室将继续在人才培养、科研创新上,为学界和业界带来双赢效果。作为一个成功的合作案例,微软亚洲研究院也积累了大量经验,将继续致力于与国内外顶尖高校合作,进行前沿研究,携手推动计算机科学的发展。