分享到微博 分享到人人 分享到LinkedIn 分享到Email
微软牛津计划:拥抱机器学习,再次升级
作者 Ryan Galgon,微软技术与研究部的高级项目经理
2015年11月13日

微软牛津计划主页:https://cn.projectoxford.ai/

今年上半年,微软发布了牛津计划——一个由API、SDK和服务构成的套件,可以帮助开发人员开发出更智能,交互更多样的应用。牛津计划是在微软一系列机器学习API组合的基础上扩展而来,藉由牛津计划,开发人员能够在他们的应用中轻松添加智能功能——例如视觉、语音、面部识别和语言理解等。牛津计划中的的人脸识别、语音识别和计算机视觉的一系列API已经被应用在微软小娜分析套件里。 

如今,牛津计划中的语言理解智能服务(LUIS)的覆盖面进一步扩大,包括测试版的推出、支持中文和提供更多的预设模型。此外,牛津计划面部识别、可视化工具和语音识别SDK的测试版现在也可以通过GitHub获取。

支持中文!LUIS的更多新功能

LUIS允许开发人员构建模型用于自己的应用中,从而理解针对该应用的指令和自然语言。 

范例:LUIS对“move my meeting called budget review to be at 2 pm tomorrow”这句话的分析。LUIS同时确定了语句内(改变_日程_条目)的意图以及时间、日期和事件标题等实体对象。

​先前,LUIS项目仅限受邀人员使用,而今LUIS测试版正式面向所有开发者公开。最新功能也同步上线,包括:

支持中文:提供中文支持是大家呼声最高的功能之一。现在,你可以随心所欲创建英文或中文LUIS应用了!此外,LUIS还能够正确处理夹杂英文片段的中文句子。

应用的导入和导出:现在,你向LUIS输入的所有应用数据都可以下载到JSON object中,并且能通过导入该JSON object来创建一个全新的应用。这样,开发人员就能够轻松复制应用、与他人共享应用以及对自己的应用进行代码管理——例如,让使用了LUIS的应用程序保持版本和代码的统一。

扩充预设模型:LUIS向公众开放的许多模型也在微软的产品中使用,目前可获取的模型数量从想法到实体已经不止扩大了三倍——从原来的56个到现在多达196个。

​自推出以来,我们一直通过MSDN论坛与早期开发人员进行密切合作,我们还增加了未标记语句的批量导入,常规表示法机器学习功能、超高密集度的日期时间实体和大量的界面润色。

LUIS的标记界面可以很容易地对英语或中文语句贴标签,并迅速构建定制模型。

开发人员已经开发了许多非常神奇的LUIS应用!例如,Meekan公司为多个平台(Slack、HipChat等)开发的文本机器人可以帮助忙碌的人进行更充分的日程安排。这种机器人的独特之处在于它能够识别复杂的时间跨度和行动(例如“把会议安排在周三中午前后”,或“把明天的会议延后到周五下午”)。Meekan在所有意向和标签识别功能中使用了LUIS,以帮助区分公司的文本机器人可以或不可以帮助执行的行动,同时从用户的表述中发现重要的实体对象。

“从原型到生产准备的过程中,LUIS为我们节省了大量时间,”Meekan.com的联合创始人兼首席技术官Eyal Yavor说:“我们专注于用户交互,而LUIS则在后台工作,帮助我们了解用户的使用情况。刚开始我们仅用少量样本语句,LUIS的反馈回路就能帮助我们迅速改善机器人。”

微软GigJam项目还利用LUIS进行语言理解。目前尚处于预览阶段的GigJam提供了前所未有的新途径,打破设备、应用和人与人之间的隔阂,帮助团队完成任务,并转变业务流程。GigJam的用户只需要说“显示我的邮件”“把这些邮件排序”或(在屏幕上圈定了一张发票后)“和约翰AA”,这些五花八门、脱口而出的表达都将由LUIS来处理。

开发人员也曾告诉我们,他们使用LUIS构建了用于订购比萨饼、控制家里的设备、预约出租车和播放音乐的对话系统。通过将LUIS与其他牛津计划服务配对使用,开发人员还创造出了一些非常令人惊喜的东西,共有超过4000种模型,并且这个数字仍在不断增长。例如,开发人员借助牛津计划的语音API,设计了一个为人们说绕口令的技能打分的系统。通过与牛津计划中针对光学字符识别的视觉API配对使用,LUIS甚至可以识别meme图中的文字

牛津计划SDK现已登陆GitHub

自从牛津计划推出以来,微软开发人员使用API创建了How-Old.netTwinsOrNot.net(微软我们)等众多受欢迎的网站。今天,我们将牛津计划中的脸部识别、计算机视觉和语音识别SDK加入GitHub,力图帮助开发人员更容易地创建属于自己的应用。

通过专门用于客户端SDK的牛津计划软件库,开发人员能够查看源代码、访问历史记录、提交问题甚至为代码编写做出贡献。

由此,我们得以更好地与开发者群体携手,打造一个更具包容性、更强大的平台。目前软件库提供对Windows和Android两大平台在面部识别、计算机视觉和语音识别支持,我们正在努力增加其他的软件包,并增加呼声很高的、在iOS和Node.js两个领域的SDK支持。请访问https://github.com/Microsoft/ProjectOxford-ClientSDK,关注微软牛津计划,并进行分享和创造,同时也欢迎大家的意见、问题和引入请求。GitHub也不是唯一能找到牛津计划的地方——如需改善工作流程,您还可以分别通过NuGet和Maven获取我们的Windows和Android软件包。

现在就访问http://www.projectoxford.ai/sdk或GitHub(https://github.com/Microsoft/ProjectOxford-ClientSDK),试用牛津计划的SDK吧。期待大家创造的更多精彩。