分享到微博 分享到人人 分享到LinkedIn 分享到Email
强化机器翻译、升级用户体验
作者 微软研究院
2011年9月13日

2009年12月,微软亚洲研究院在线英语词典研究项目成果英库(Engkoo)上线, 2010年9月英库词典更名为 “必应词典”,并正式发布到必应搜索引擎首页。必应词典推出一年来,除网页版外还陆续发布了桌面版及云词典产品,发布一年来访问量增长了五倍之多,用户忠诚度和粘度非常高,成为深受中国广大英语学习和使用者喜爱的品牌。近日,MSN(中国)在必应词典一周年之际,推出了必应词典桌面版1.5,以强化的机器翻译核心,为用户提供更为准确的句子及段落翻译结果,进一步提升了用户体验。

强化机器翻译核心

必应词典的优势之一,就是在线词典与在线翻译的合二为一。不同于传统的在线英语学习工具分为在线词典及在线翻译两个产品,必应词典自诞生之日起,就可以在一个窗口查询短语、句子或段落。“这样可以让用户更简单、更方便地使用,一个入口即可获得多重功能。”MSN(中国)搜索业务主管产品经理黄鼎隆表示。

机器翻译是必应词典最核心的技术之一,也是用户使用体验最重要的体现。如何让机器翻译更智能,让整句翻译不再雷人,成为在线翻译软件产品的竞争重点。机器翻译技术集中了计算机、语言学、概率统计和信息论等多门学科的知识,需要建立大规模的双语词典、语法规则、翻译模板和语料库,还需要开发专门的机器学习软件,以便从语料库中获取大规模的语言翻译知识。微软亚洲研究院自1998年开始机器翻译的研究后,便不断取得显著成果。目前已从微软亚洲研究院机器翻译研究中产生了30余篇学术论文及50余项技术专利。

随必应词典桌面版1.5发布的必应机器翻译核心第二版,基于更先进的层次化统计翻译模型,建构于必应搜索引擎的海量数据仓库和强大的分布式计算平台之上,是由海量数据驱动的、基于机器学习和统计建模的最新一代机器翻译引擎,能够实现高效准确的译文生成。与传统的短语翻译模型不同,层次化翻译模型可反映语言内在的层次结构和搭配结构,能更好的实现语法差异大的语言间的翻译。

据微软亚洲研究院自然语言组研究员、项目带头人李沐介绍,必应词典的机器翻译核心首次在2008年由美国国家技术标准局(NIST)举办的翻译技术评测,即获得了中英、英中翻译的最好成绩。NIST的评测目前是全球最权威的机器翻译技术评测。此外,该机器翻译技术在参加2008年和2009年中国机器翻译评测时也均名列榜首。

以用户为中心、设计驱动开发

“设计驱动开发”的开发模式是必应词典研发团队的首次尝试,除了产品本身要经得住层层考验,其界面设计、应用体验还必须要达到设计师的高标准、严要求,产品才能出炉,设计师成为了产品能否发布的“最高决策人”。

传统开发模式偏向工程师视角,更注重功能和技术,“设计驱动开发”则将“内在美”和“外在美”更好地统一为一体。例如在背单词功能模块中增加了动画效果,界面设计也更为酷炫。虽然增加了大量的开发工作,但开发人员仍然积极探索各种实现方式,既达到美观、易用性要求,同时又不影响产品功能、性能、稳定性等。“要把软件做成艺术,”微软亚洲研究院创新工程中心高级研发工程师黄贤俊如是强调。

例如,必应词典桌面版1.5可以支持非规则边界的“皮肤”,是设计师与工程师协作的代表。非规则边界的技术处理复杂、开发成本高,很多传统软件公司不会支持该功能,但因为它能给用户带来不同寻常的应用体验,必应词典研发团队将它坚持了下来。这从另一个侧面再次体现了必应词典的品牌理念——“快乐英语 有问必应”,让搜索过程变得更加快乐。

据黄贤俊介绍,必应词典是微软技术创新和用户需求相结合的重要体现,必应词典团队从未间断地研究中国用户的使用习惯,并致力于将更多符合中国用户需求的产品和服务带给用户。推出半年来,必应词典桌面版不断听取用户反馈,并快速改进产品,加快了版本更新的速度。研发团队不断通过各种渠道与用户直接沟通,或是邀请用户来到研发中心,或是到用户实际工作的环境中去,或是进行用户网上调查。例如,桌面版1.5在背单词功能模块里增加声音支持,以及学习进度整体导入和导出功能等,都是来自用户的创意。

微软亚洲研究院创新工程技术总监田江森表示:“微软亚洲研究院致力于不断转化自己的研究成果,为此组建了专门的创新转化工程团队,并以实践驱动为指导原则,必应词典就是这一创新转化机制的优秀成果。未来,我们还将源源不断地把研究成果转换到微软产品中,为用户带来更好的体验。”

不断获得市场认可

目前,微软亚洲研究院已经从必应词典研究项目中产生了超过25篇学术论文及40余项专利。而必应词典自推出以来,也在不断获得市场的认可。

2011年5月,必应词典发布了云词典,向合作伙伴提供云翻译功能。必应云词典是必应词典的“云”服务模式,在部署了必应云词典的网页,用户无需安装词典桌面版,即可随时查看网页内容的地道中英文翻译。目前,人民网英文版(english.peopledaily.com.cn)、中国日报网络版(www.chinadaily.com.cn)、译言网(www.yeeyan.org)和普特英语网(www.putclub.com)等,都已经成为必应云词典的合作伙伴。

2010年11月,必应词典还获得了华尔街日报“2010亚洲创新奖・读者之选大奖”。亚洲创新奖旨在表彰提出创新理念、方法或技术的企业和个人。最终获奖者经过主办方从来自亚太地区13个国家和地区的近300个参选技术中严格筛选而出,涉及范围包括生物工程、环境效益、软件等众多创新领域。必应词典打破了搜索的语言障碍,让全世界的知识为更多的人所享用。

2010年上海世博会期间,必应词典与共青团上海市委合作“雷人英语街头大搜索”活动,旨在号召志愿者参与到此次活动中来,在世博前后发现并消灭街头的“雷人英语”。必应词典为此次活动提供的平台,不仅可以将志愿者上传的雷人英语翻译成准确的语句并进行展示说明,还可以通过必应地图查看到“雷人英语”所在的具体位置。包括《纽约时报》在内的国外主流媒体以“上海市政府发起消灭雷人英语活动迎接世博会“为主题对此次活动进行了报道。

2010年11月至2011年2月,必应词典口模大赛举行,成功推广了微软首创、全球独一无二的“例句朗读合成视频”功能。活动得到了应征者的踊跃参与和支持,短短的两个月之内收到了上万份选手的应征简历。此外,网友分享的参赛视频高达900多个,酷6网站网友的投票数和视频播放总数都分别超过了7千万次。在参赛选手中除了有电视台节目主持人、网络红人、英语培训机构的老师、外国人和海外留学生等,甚至还有80岁高龄的老人和在珠峰大本营海拔最高的特殊参赛选手。

MSN(中国)搜索业务副总经理刘宁表示:“微软将把更多的创新技术应用到必应词典以及必应搜索中,通过不断改进和推出丰富的功能来完善用户的搜索过程,为用户打造‘快乐搜索,有问必应’的搜索体验。”

附:必应词典大事记

l 2009年12月,微软亚洲研究院在线英语词典研究项目成果英库(Engkoo)上线。

l 2010年9月,英库正式更名为必应词典,必应词典网页版正式上线。

l 2010年上海世博会期间,必应词典与共青团上海市委合作,提升上海地区的英语翻译质量。

l 2010年11月,微软必应词典获得华尔街日报“2010亚洲创新奖・读者之选大奖”。

l 2010年11月至2011年2月,微软必应词典口模大赛成功举行,上万名用户参加了大赛,成功推广了微软首创、全球独一无二的“例句朗读合成视频”功能。

l 2011年5月,必应词典正式推出桌布版,同时必应云词典上线。

l 2011年8月,必应云词典被人民网英文版采用并正式上线,为其提供云翻译功能。必应云词典发布半年内,已为中国日报网络版、人民网英文版、译言网和普特英语网等采用。

l 2011年9月,必应词典推出桌面版1.5,必应词典机器翻译更新第二版。

附:必应词典产品介绍

必应词典网页版:必应词典(dict.bing.com.cn)是目前词库最为庞大的在线词典,拥有千万级词汇和例句,同时还融合了包括微软 Office 词典、微软电子百科全书等十余部经过授权的专业词典;它通过对整个互联网的网页进行及时分析、抓取和整理,进而获得数量巨大且不断更新的双语例句和短语。其中智能联想输入、拼音搜索、边听边搜、网络流行词汇翻译大全、中英文逐字对照、标签查询和智能对比等一系列突出功能更是受到了用户的广泛好评。当用户搜索词汇时,必应词典不仅能给出准确的解释,而且能够给出不同语境和用途的示范例句,帮户用户准确掌握词汇的具体用法,实现快乐的自助式英语学习。

必应词典桌面版:它不仅包含传统客户端词典的常用功能——中英文单词和短语查询等,还拥有词条对比、近音词搜索、词性百搭搜索等众多基于搜索的特色功能,以及基于机器翻译技术的整句及整段翻译功能,还具备云端与本地词库查询双重搜索模式。必应词典桌面版的其他特性还包括拼音例句、搭配建议、例句朗读合成视频、逐词释义、TTS语音合成、查询建议、多词条显示等。其中的例句朗读合成视频功能,由真人口模示范朗读英文,让英文学习变得更加快乐。

必应云词典:是必应词典的“云”服务模式,在部署了必应云词典的网页,用户无需安装词典桌面版,即可随时查看网页内容的地道英文翻译。目前合作网站包括China Daily、人民网英文版、译言网和普特英语网等。

必应词典机器翻译:基于更先进的层次化统计翻译模型,是由海量数据驱动的、基于机器学习和统计建模的最新一代机器翻译引擎。它从互联网数以十亿计网页中获取的海量翻译数据,体现人类语言的最新变化和翻译的多样性。它利用先进的机器学习手段,自动获取大规模可靠的翻译知识,在统计机器翻译的理论框架下,基于微软亚洲研究院先进的中英两种语言的词汇和句法分析技术,完成了高质量全自动的快速翻译。必应词典的机器翻译在2008年首次参加全球机器翻译技术比赛NIST即获得了中英翻译最高分的成绩;该机器翻译技术在参加2008年和2009年中国机器翻译评测时也均名列榜首。