1-机器学习-机器学习概述

总结

  人工智能和机器学习的区别:机器学习可以实现人工智能

  机器学习概念:机器学习就是利用样本数据进行一系列分析得到一个数据模型。这个模型可以对未知数据进行预测或分类

  模型:对数据进行一系列分析后得到的产物,模型,模型存在的意义就是对未知数据进行预测

  训练模型:将样本数据进行分析,训练他们,得到训练后的产物,模型

  样本数据:特征数据和标签数据

  模型分类

    • 有监督学习:样本数据包含特征数据和标签数据
    • 无监督学习:样本数据只包含特征数据

  样本数据载体:存储csv文件中

    不用数据库的原因:数据库存储数据格式不符合机器学习数据格式;

              量级大的文件数据库无法高效读写。

机器学习简介

  • 祖师爷
    • 艾伦.图灵,人工智能之父。其最大的成就就是图灵测试。一个人和一个机器跟你去聊天,你不知道对方是人还是机器,如果经过聊天后,你分辨不出谁是人谁是机器则说明这个机器通过了图灵测试。
  • 人工智能和机器学习的区别?
    • 机器学习是实现人工智能的一种技术手段(机器学习可以实现人工智能)
  • 什么是机器学习?
    • 官方解释:
      • 机器学习就是从【数据】中自动分析获得【规律(模型)】,并利用规律对未知数据进行【预测】。
    • 我的解释
      • 对样本数据(特征数据和标签数据)进行分析,得到数据的规律,利用这个规律对未知数据进行预测或分类
  • 老师的的解释
    • 模型:特殊的对象。在对象内部已经被集成或者封装好了某种形式的算法/方程式,只不过该方程还没有求出解。(一个未求出解的方程的解对象)

    • 模型的作用

      • 实现对未知数据的预测和分类。(方程的解可以对未知的数据进行预测和分类
    • 样本数据

      • 特征:自变量。楼层 采光率 面积
      • 标签:因变量。售价
      • 样本数据和模型之间的关联?
        • 训练模型:将样本数据带入到模型,使得模型中的方程可以求出解。(将数据带入方程得到
        • 模型实现的预测或者分类其实就是模型中方程计算出来的结果。(模型的解的作用对未知数据预测或分类
    • 模型的分类
      • 有监督学习
        • 如果模型需要的样本数据必须包含特征数据和标签数据的模型,属于有监督学习分类。
      • 无监督学习
        • 模型需要的样本需要包含特征数据即可。
  • 样本数据(数据集)的载体:
    • 通常情况下历史数据都不会存储在数据库中,而是存储在文件中(csv文件)
    • 数据库存储数据存在的问题:
      • 性能瓶颈:数据量级大的数据很难存储和进行高效的读写。
      • 数据存储格式不符合机器学习要求的数据格式
 
  • 样本数据的获取途径:
    • kaggle:数据竞赛平台。
    • UCI数据集:是一个常用的机器学习标准测试数据集,是加州大学欧文分校(University of CaliforniaIrvine)提出的用于机器学习的数据库
    • sklearn
 
  • 为什么需要机器学习
    • 解放生产力:比如智能客服(不知疲倦24小时工作,还不用支付其工资)可以代替人工客服。
    • 解决专业问题:比如医疗方面的【ET医疗】,可以辅助医生进行相关症状的判断,数据显示,人类医生的平均准确率为60%-70%,而当下算法的准确率已经达到85%。
    • 提供社会便利:杭州的城市大脑,无人超市等等。
 
  • 机器学习的价值体现
    • 价值体现在各个方面:医疗,航空,教育,物流,电商......
    • 让机器学习程序替换手动的步骤,减少企业的成本也提高企业的效率。
    • 例子:汽车销售在对新车进行推广的时候,一般都是将宣传手册投放给了所有的客户,从中进行目标客户的定位。但是如果使用机器学习对客户进行指定分类,然后将手册可以根据分类投放到不同类别的客户中,则这样就大大增加了商业机会。

  

原文地址:https://www.cnblogs.com/wgwg/p/13345343.html