机器学习之分类算法(2.0)

转换器 - 特征工程的父类

1 实例化 (实例化的是一个转换器类(Transformer))
2 调用fit_transform(对于文档建立分类词频矩阵,不能同时调用)
标准化:
         (x - mean) / std
         fit_transform()
                    fit() 计算 每一列的平均值、标准差
                    transform() (x - mean) / std进行最终的转换

估计器(sklearn机器学习算法的实现)

在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API

  • 1、用于分类的估计器:
    • sklearn.neighbors k-近邻算法
    • sklearn.naive_bayes 贝叶斯
    • sklearn.linear_model.LogisticRegression 逻辑回归
    • sklearn.tree 决策树与随机森林
  • 2、用于回归的估计器:
    • sklearn.linear_model.LinearRegression 线性回归
    • sklearn.linear_model.Ridge 岭回归
  • 3、用于无监督学习的估计器
    • sklearn.cluster.KMeans 聚类

    流程:
         1 实例化一个estimator
         2 estimator.fit(x_train, y_train) 计算
           —— 调用完毕,模型生成
         3 模型评估:
                 1)直接比对真实值和预测值
                          y_predict = estimator.predict(x_test)
                          y_test == y_predict
                 2)计算准确率
                         accuracy = estimator.score(x_test, y_test)

原文地址:https://www.cnblogs.com/sima-3/p/14812100.html