分享到微博 分享到人人 分享到LinkedIn 分享到Email
机器学习在微软

原文作者:前微软研究院杰出科学家John Platt

译者:牛芳琪

大家好!我是John Platt,我在微软钻研机器学习(以下简称ML)算法已经17年了。随着最近这几年机器学习开始受到广泛关注,人们开始经常向我询问:“什么是机器学习?它能用来做什么?”

我非常乐意回答这些提问。其实,机器学习已经广泛应用于微软的大量产品中——它们使得微软变成了机器学习技术研究的乐园,这对于我就像一个孩子走进了一家糖果店一样。

一般来讲,机器学习能够将数据集转换成软件的组件,也就是通常所说的“模型”,这些模型可以代表数据集并且推广到新的数据从而进行预测。由于机器学习的广泛使用,我觉得有必要把它进行一个粗略的分类。机器学习的应用大致可以分为以下三类:

1、数据挖掘:机器学习可以帮助人们从大型数据库里得到深刻的见解。

2、统计工程: 机器学习可以用来把数据转换到软件中,继而对不确定数据做决策。

3、人工智能: 机器学习可以用来模拟人类的思维,帮助计算机更好的理解我们的世界。

在微软,机器学习已被广泛使用在上述三个领域。例如:

打击恶意软件

微软恶意软件保护中心与微软研究院合作,利用机器学习创建了软件来自动检测恶意软件,并帮助分析员深入了解恶意软件的开发。你可以从Dennis Batchelder博客里了解到更多关于这方面的内容。

创建一个搜索引擎

微软的必应搜索引擎是一个非常复杂的系统,它解读你的查询,搜索网页并返回对你有用的信息。正因为必应引擎有这么高的流量,所以必须使用自动的决策制定系统来处理自然语言的不确定性和歧义性。我们已经用机器学习创建了许多必应引擎的组件,这些组件相互配合帮助必应成为高质量的搜索引擎。机器学习对于搜索的一个典型的应用是排序:几年前,一个来自微软研究院的队伍利用我们开发的算法赢得了学习排序的比赛

使计算机能看且能听

微软一直在推动计算机视觉和语音识别领域的发展。Kinect里识别手势的软件就是由机器学习开发的。微软的语音识别系统是基于深度学习的,这是机器学习中受到大脑结构的启发而形成的一个模型。此外,我们还使用机器学习创造了一个实时语音翻译系统

看到这些令人兴奋的应用,我意识到现在正是机器学习的黄金时代。许多研究者和开发人员已经在这个领域研究和探索了多年。得益于摩尔定律和互联网,我们现在有足够的标记数据和大量的计算使得机器学习创造卓越的软件。我期待着为其他开发者提供我们的算法和工具,使他们能发挥创造力,创造出更多属于的好的应用。

在下一篇文章中,我将谈论过去20年机器学习在微软的发展。我很期待有机会可以通过博客与读者进行互动!

了解更多John Platt的研究,可以持续关注他的Twitter

原文地址:http://blogs.technet.com/b/machinelearning

本文由微软亚洲研究院和译言合作翻译,非商业转载请注明译者、来源,未经许可不得商业使用。