分享到微博 分享到人人 分享到LinkedIn 分享到Email
从第一步,到每一步:微软学术搜索
微软亚洲研究院
2015年10月29日

文献检索对于每一个从事学术研究的人来说都不陌生。事实上,文献检索作为一门基础课程,一直都是低年级的本科生和硕士生的必修课程。不久前,微软全球资深副总裁,微软亚太研发集团主席兼微软亚洲研究院院长洪小文博士在和微软创新人才学院的同学们交流科研经验的时候,特地提出文献调研是科研工作起步时极为重要的一环。

洪小文博士提到,做研究很重要的一个素质是knowledgeable(博学),即要了解自己研究方向的现状,也要对自己研究领域上不同方向的信息了如指掌。而科研信息调研的过程——洪小文博士称之为literature survey——很大程度上决定着科研人员的研究方向。这也解释了为什么学术搜索能力是研究人员们最看重的能力之一。

随着科学技术的迅猛发展,研究人员了解的科研内容和接触信息的方式越发多元化,因此,一个开放且共享的学术平台尤为重要。但目前对于研究人员来说,特别是国内的学术搜索环境,长久以来都不甚理想。从学术圈入门者的角度出发,拥有一个易于上手,内容全面,联想能力强的学术搜索引擎工具可以说是一个迫在眉睫的需求。

一个让人欣喜的消息是,近期上线的微软学术搜索恰好满足了这一需求。微软学术搜索是“微软学术”服务推出的免费学术搜索引擎,可以帮助用户全面、准确地查找学术论文、国际会议、权威期刊、研究专家及领域等专业学术资源。而为了方便用户使用,微软学术搜索已嵌入必应搜索引擎,在必应搜索首页就能找到。

智能化的学术平台

传统学术搜索工具的搜索理念仍以关键字匹配为主流。以人工智能(Artificial Intelligence)为例,能够搜到标题中带有Artificial Intelligence词汇的文章数不胜数。但对于一个新人来说,无论是按时间检索还是按相关性检索都无法在短时间对人工智能拥有一个学术图谱式的认知。人工智能的定义是什么?相关领域有哪些?哪些会议与之密切相关?这个领域有哪些重要学者的研究最值得关注?

没错,这些问题在一个新人友好型学术搜索引擎——微软学术搜索上都能得到一键式解决!其使用的核心技术基于强大的知识图谱体系,通过对学术论文、国际会议、权威期刊、研究专家及领域等专业学术资源实体的聚合,构建了学术图谱体系,更加适用于学术领域的垂直搜索特点。

如上图中所示,当查询关键词涉及研究领域、作者、会议、期刊、学术机构时,微软学术搜索提供了丰富的知识卡片。在人工智能(Artificial Intelligence)的搜索结果页上,知识卡片中呈现的信息极为丰富,如领域简介,相关会议,领域大咖,在线课程等,这为用户提供了快速了解该领域知识的便捷途径,从而提高学习效率。

那么,微软学术搜索在搜索文献上的功力又如何呢?输入想要查找的参考文献标题,例如“Mining frequent patterns without candidate generation”,可直接查看论文,或选择下载(通过有访问权限的源站获取论文)。“引用”功能提供相应格式的论文引用,还可以直接导入链接至论文写作。

当然,这些基础的功能肯定是不能满足天天和论文打交道的科研人们的。在论文搜索结果页面,论文会以结构化的摘要方式呈现,期刊、作者、单位、关键词等信息一目了然,用户可判断是否继续阅读,或点击跳转至相关的期刊、作者等相关论文列表。

面对数量繁多的论文文献时,你是否曾想过“要是有人能帮我看论文就好了”,“谁能帮我找到那篇我最需要的论文呀”?现在,由人工智能技术支持的微软学术搜索,通过对海量数据的阅读和学习,挖掘出多样的语义,从而帮助用户更加便捷、准确的查找信息。当前版本除了知识卡片和结构化论文搜索页面之外,后台提供的高级搜索功能则更能体现微软学术搜索理解复杂语义的智能特征。

高级搜索即多条件筛选,可通过简单的查询语法叠加,实现多维度查询。不同于以往文献搜索繁琐的搜索语法,微软学术搜索提供的高级搜索服务更接近于自然语言的理解和表达,即用最简单的自然语言就能实现多维度的高级搜索,简化使用流程。在海量数据中实现高效的多维度查询一直都是业界难题,而每增加一个维度都会令计算量呈几何级数增加。但对用户来说,通常条件越丰富结果越精确,而微软学术搜索自动建议生成也能充分满足用户从无到有,从有到多的图谱式认知。

那么,高级搜索功能要如何触发呢?以搜索洪小文博士(Hsiao-Wuen Hon)的论文为例。首先输入“papers by Hsiao-Wuen Hon”即可查询洪小文博士的论文,每当查询后增加空格,都可获得新的自动建议,猜出你心中所想!如下所示黑体部分,即为洪小文博士的论文合著学者。

还想了解更多?你可以增加查询条件后再次输入空格,即可获得新的自动建议列表。图中“papers by hsiaowuen hon by meiyuh hwang in icassp”即为二位合作发表于icassp的论文列表,了解大牛们历届会议论文,自然也可以窥见具体方向研究进程。如选择另一搜索建议“papers by hsiaowuen hon by meiyuh hwang by kaifu lee”则可获得hsiaowuen hon/meiyuh hwang/kaifu lee三位合著的论文列表。

除“微软学术搜索”,“微软学术”还推出了可提供个性化服务的微软小娜学术兴趣卡以及学术新闻等针对学术界用户的智能服务。相信由微软学术开发的一系列功能全面的工具集成开放学术平台很快能造福每一位学术界的研究人员。

从学术中来,到学术中去

微软学术搜索的构思由来已久,早在微软全球执行副总裁沈向洋担任微软亚洲研究院院长期间便有了微软学术搜索雏形Libra——一个从刚推出便在算法和理念上广受学界用户好评的系统。此后,为提供更加稳定的产品服务,微软互联网工程院将其整合至必应搜索产品线,作为专业的垂直搜索领域推出。基于必应的大数据搜索技术及微软研究院的先进算法,目前上线的版本同时整合了Azure云计算能力,并在产品性能、数据更新、使用体验等多方面进行了深度优化。

在微软亚洲研究院与清华大学联合主办的第十七届 “二十一世纪的计算” 大型学术研讨会上,微软与清华共同签署了 “学术大数据项目” 合作备忘录,清华数据科学研究院将为微软学术搜索提供丰富的学术数据以及相应的咨询和建议。

源于一个简单的目标和构想,微软学术搜索一步一步茁壮成长。目前微软学术搜索已提供海量数据共享、协同改进算法、提供开放接口等一系列合作方式,期待与学术界的合作伙伴共建学术联盟,携手为中国科研创新和生态系统打造开放平台。

现在就去体验微软学术搜索的全面功能吧!从学术中走出的微软学术搜索,希望能陪伴你走好学术生涯里的每一步。无论你是学术新人还是行业大神;无论你想检索的是海外论文,某个学术领域,还是深入了解某位学术大咖,微软学术搜索都能提供给你理想的结果!别忘了与微软学术搜索团队进行互动合作,留下你的想法和建议,让微软学术搜索与你的学术旅程一样,越走越好。