机器学习1-从Ng的视频开始

内容源于Andrew Ng视频与自己的理解

机器学习?

机器学习(Machine Learning)的定义大体上有两种,第一种是亚瑟·塞缪尔(Arthur Samuel)提出的:机器学习是通过给予电脑在为做特定编写程序的前提下具备学习得能力。Arthur本人亦是人工智能(AI)的先驱。现代机器学习教父Tom Mitchell先生对于机器学习给出了第二种较为现代的定义:通过从相关的任务T下的经验E中学习,其行为的表现用P来测量,计算机程序在不断的学习下,它对于任务T下的表现通过P测量,P随着经验E不断增长。
这里按照Ng视频下的观点,对机器学习进行一般分类:无监督学习和有监督学习。

有监督学习-supervised learning

在有监督的学习模型下,给定的数据集具有事先定义好的标签-label,即已知正确的输出结果,去学习输入和输出之间关系。如下图,输入的数据使用红色X与蓝色O区分:

一般有监督的学习问题可以划分为:回归和分类问题。在回归问题中,我们试图预测出连续输出的结果,意味着我们根据输入变量(关系)描绘出连续的函数。对于分类问题,我们试图根据离散结果预测结果。总而言之,我们尝试以离散的分类关系描绘输入变量。

分类问题&回归问题

给出实际市场上房屋的尺寸数据集,试图预测这些房子的价格。价格作为尺寸的函数关系是连续的输出,因此,这是一个回归问题,这里我的理解是用一个函数曲线学习房屋尺寸与价格的关系。

我们也可以通过关心房价高于或低于给定要求价格而非推测其售出价格,进而将问题转变为分类问题,高于价格为label1、低于价格为label2。 也即:(1)回归问题:对给出的一个人的照片,我们以此照片为基础预测该人的年龄。(2)分类问题:已知意味病人体内后有肿瘤,我们试图预测该肿瘤是良性或恶性。

无监督学习--unsupervised learning

无监督学习下,我们在对应该的输出结果并不知道或知道很少下解决问题的方式。我们可以从并不必要知道变量作用下从数据中划分结构。总之,在无监督下,没有基于预测结果的反馈。

簇:收集了100万的基因组,将这些基因组自动划分为多个小组,分类依据按照不同基因变量中相同的成分,如位置,角色,寿命等。
非-簇:鸡尾酒舞会算法,使你在吵杂的环境下寻找结构(如:在鸡尾酒舞会中将个人的交谈声和音乐声做分离)。

版权声明:本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文链接。
原文地址:https://www.cnblogs.com/SrtFrmGNU/p/6950053.html