2.机器学习算法分类以及开发流程

一、机器学习算法分类

二、开发流程

三、scikit-learn操作数据

1、数据集

 

2、数据分割

代码:

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split


li = load_iris()

# test_size=0.25:将数据集分为75%和25%,25%为测试集
x_train, x_test, y_train, y_test = train_test_split(li.data,li.target,test_size=0.25)

print("训练集的特征值和目标值",x_train,y_train)
print("测试集的特征值和目标值",x_test,y_test)

3、估计器

 

四、模型评估指标

准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure

准确率是相对所有分类结果;精确率、召回率、F1-score是相对于某一个分类的预测评估标准。

 

详细介绍见:https://blog.csdn.net/u012879957/article/details/80564148 、

https://blog.csdn.net/houyanhua1/article/details/87968953?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase

api:

 代码:

#精准率和召回率
    print("精准率和召回率:",classification_report(y_test,y_predict,target_names=news.target_names))

五、模型保存

 

原文地址:https://www.cnblogs.com/dominik/p/13741226.html