序言

过去二十年，计算机科学领域正在发生着一场静默的革命。如今，我们越来越发现计算机程序—可以自动改变自己的行为以更好的适应任务需求。现在，有的程序已经可以进行人脸识别，进行语言翻译、自动驾驶，推荐好看的电影—将来程序能做的事情会更多。

过去，通常都是程序员使用编程语言实现算法，来定义程序的功能。但是现在，对于某些任务来说，我们无需写程序，只需收集数据。这些数据包括需要完成的实例和学习算法，该学习算法会自动修改学习者程序，以匹配需求中指定的数据。

自从计算机于上世纪中期出现后，我们的生活变得越来越计算机化和数字化。计算机已经不再是曾经的计算器。数据库和数字化媒体已取代打印机成为信息存储的主要媒介。通过计算机网络进行的数字化交流也已经取代了信件，成为了信息交流的主要模式。个人电脑拥有图形化操作界面，可以连接手机和其他智能设备，这使得计算机变成了广泛使用的家用设备，就像电视机和微波炉一样。如今得益于在线网络---各种信息，不只是数字和文本，还包括图像，视频，音频等等都可以以数字化的方式进行存储，处理和传输。这种信息的数字化，会产生大量的数据，这种数据潮—我们称为数据地震—触发了人们对于数据分析和机器学习的广泛的兴趣。

对于许多应用来说，从憧憬到演讲，从翻译到机器人学—我们无法设计出非常好的算法，尽管相关的研究从20世纪50年代就开始了。但是，我们却可以很容易的从这些应用中搜集数据，所以现在的办法是让程序自动从数据中学习，从而用学习程序替代程序员。这正是机器学习的用武之地。使用机器学习，并不仅仅因为近二十年来，数据持续增长，数据量更大，还因为将数据处理成知识的机器学习理论取得了显著的进步。

今天，在零售业、金融业和制造业等不同类型的行业中，越来越多的数据持续产生并收集了起来。在不同的科学领域如天文学、生物科学中亦是如此。在我们的日常生活中也是这样，数字技术日益渗透到我们的日常生活中，深化了我们的数字脚印，我们不仅是消费者和用户，还是社交媒体用户—我们把越来越多的日常生活发布在社交媒体上，这些记录也变成了数据。无论数据来自商业、科学还是个人，如果不去利用，它们就毫无用处。聪明的人找到了使用这些数据的新方法，把它们变成了有用的产品和服务。机器学习在这个过程中发挥了越发重要的作用。

我们相信，在这些看似复杂的庞大数据量背后，一定存在着简单的解释方法。也就是说，尽管数据量很大，一定可以以一种相对简单的模式来解释，这种模式包含少量的隐含因素以及隐含因素之间的交互。想想数百万的消费者，他们每天在网上或当地的超市购买成千上万的商品。这意味着交易数据库非常庞大，但是还好这些数据符合某种模式。人们并不是随机购物的。举办派对的消费者，会购买某一特定集合的商品。家里有孩子的消费者，会购买另一集合的商品—这就是解释客户行为的隐含因素。由此可以推断出一个隐形模型-也就是指，通过观察到的数据得到了这些潜在的因素和它们之间的相互作用—这些数据就是机器学习的核心。

机器学习不只是用应用于商业、用来从信息中提取数据的方法。机器学习还是智能系统的前提。智能系统要能够适应其所在环境，重复成功而非失败经验。之前，研究人员一直认为，要想实现人工智能系统，我们需要新的范例、新的思考方式、新的计算模型、一整套新的算法。考虑到最近几期学习在各个领域取得的成功范例，现在我们可以说，要想实现人工智能系统，我们需要的不是一套新的科学算法，而是更多的例数据，需要充足的计算能力，可以在海量数据上运行学习算法，从中得到必须的算法。

我们由此可能推测出，像机器翻译及计划这样的任务，可以使用这样的学习算法--相对简单，却又需要使用大量的例数据训练。最近，深度学习的成功证明了这一推测。

看起来人工智能也并非源自什么稀奇古怪的配方，而是源于耐心、完全使用简单直观的算法。

随着技术的发展，我们的计算机运行得更快，数据更多，机器学习算法将产生稍高级别的智能，用于一套新的稍稍智能的设备和软件中。在本世纪结束前，若是这种习得智能某天能达到人类的智力水平，也并不令人惊讶。

我编写这本书的时候，最享有盛名的科学杂志之一《科学》（Science）在其2015年7月15日发行本中刊登了一个关于人工智能的专题。尽管题目是人工智能，但是突出的主题却是机器学习。这只是又一个迹象，表明了机器学习现在是人工智能领域的驱动力。上世纪80年代人们对基于逻辑、编程专家系统失望后，机器学习复兴了该领域并取得了显著的成果。

本书的目的是让读者对什么是机器学习，对一些重要的学习算法的基本原理，以及一组应用范例有总体的认识与了解。本书针对的是普通读者群，只讨论了机器学习方法的本质而没有涉及任何数学和编程细节。书中也没有涉及机器学习应用方面的详细内容，讨论了一些例子，只是为了给出基本原理而不是详细讲解某一个例子。

要想了解更多关于机器学习算法的信息，读者可以参考书中重点参考的书：Ethem Alpaydin,机器学习介绍，第三版（剑桥，MA：麻省理工学院出版社，2014）

注：本书属作者免费翻译，如有版权问题，请与我联系删除。