2020.3.30 机器学习概述

1)贴上Python环境及pip list截图,了解一下大家的准备情况。暂不具备开发条件的请说明原因及打算。

2)贴上视频学习笔记,要求真实,不要抄袭,可以手写拍照。

3)什么是机器学习,有哪些分类?结合案例,写出你的理解。

1)python环境为:python3.7

 

 pip list:

 

2)

(1)机器学习概论:

①机器学习的基础需要数学分析和概率论基础。

②机器学习是人工智能的一个分支。我们使用一个计算机设计出来的系统,通过训练数据并按照一定训练的方法,不断学习以及优化,达到一个能够预测信息的一个过程。

③机器学习分类:有监督学习和无监督学习。

P1.33 预测推理方法。

④通过模型得到预测,我们需要学习建模的过程,当然预测也重要。

⑤机器学习的流程:数据收集,数据清洗,特征工程,数据建模

P1.47模型选择:决策数,回归,随机森林,SVM,聚类,高斯分布,EM算法。

⑥高数知识:微积分应用,泰勒公式,方向导数,梯度,F函数(伽马函数),凸函数(跟高数不一样的理解),(一阶可微函数,二阶可微函数,指数函数,幂函数,负对数函数,负熵函数)

⑦概率论知识:累计分布函数,概率密度函数,古典概型,

(2)Python基础:

Numpy库,数组的使用技巧:

  1. arange函数:指定起始值、终止值和步长来创建数组。
  2. reahpe:可转为几行几列。
  3. Ndarray函数:存储单一数据类型的多维数组。
  4. dytype:数组的元素类型可以通过dtype属性获得,可以通过dtype参数在创建时指定元素类型。
  5. shape:获取数组大小的属性,几行几列,可以通过该属性来强制修改。
  6. linspace函数:通过指定起始值、终止值和元素个数来创建数组,缺省包括终止值。与arange相似。
  7. endpoint:指定创建数组是否包括终值。
  8. logspace函数:可以创建等比数列。
  9. base:创建数组时的基底。
  10. dot:矩阵乘法。
  11. stack:矩阵堆叠。
  12. 数组切片的使用:左闭右开
  13. 数组索引的使用:可通过[a>0.5]获取数组里大于0.5的数值
  14. exp函数:以自然常数e为底的指数函数。

 

绘图的使用方法:

  1. figure:可以绘制一个制定大小的画布
  2. grid:可以自定义网格,其中linestyle为线条类型,alpha为透明度
  3. title:可以设置标题
  4. legend:可以显示图例
  5. xticks:自定义X轴内容
  6. yticks:自定义Y轴内容
  7. xlable:自定义X轴图例
  8. ylabel:自定义Y轴图例
  9. show:可以显示图像
  10. plot:绘制折线图
  11. bar:绘制柱状图,width可自定义柱体大小,color自定义每个柱体颜色(颜色必须传入为列表且与len(x)相对应)
  12. hist(x,bins=group_num,density=True):绘制直方图,其中x为传入的数据集,bins为传入的组数,density默认为False(是否显示频度)

 

3)

机器学习是人工智能的一个分支。使用计算机设计的一个系统,使它能根据提供的训练数据按照一定的方式来学习;随着训练次数的增加,该系统可在性能上不断学习和改进;通过参数优化的学习模型,能够用于预测相关问题的输出

分类:有监督的学习、无监督的学习和增强学习。

监督学习。监督学习是利用已标记的有限训练数据集,通过某种学习策略/方法建立一个模型,实现对新数据/实例的标记(分类)/映射。就像小孩子,第一次见到铅笔,会问家长这是什么。由于铅笔很多种,第二次也会问,这是什么,再问几次,后面再看到类似的铅笔,自己能意识到了那就是铅笔了,这就是有监督的学习。

无监督学习。无监督学习是利用无标记的有限数据描述隐藏在未标记数据中的结构/规律。比如你见到了铅笔和钢笔两种笔,但是却不知道哪个是铅笔,哪个是钢笔,但根据他们样子特征的不同鉴别出这是两种不同的笔,并对特征归类,这就是无监督学习。

③增强学习。增强学习是智能系统从环境到行为映射的学习,以使强化信号函数值最大。由于外部环境提供的信息很少,增强学习系统必须靠自身的经历进行学习。就比如你训练一条小狗,如果它做得好,你就会奖励它,如果做不好就会惩罚,渐渐地,这个小狗就学会了做正确的事情来获取奖励,这就是增强学习。

原文地址:https://www.cnblogs.com/Azan1999/p/12610985.html