2.机器学习算法分类以及开发流程

一、机器学习算法分类

二、开发流程

三、scikit-learn操作数据

1、数据集

2、数据分割

代码：

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split


li = load_iris()

# test_size=0.25:将数据集分为75%和25%，25%为测试集
x_train, x_test, y_train, y_test = train_test_split(li.data,li.target,test_size=0.25)

print("训练集的特征值和目标值",x_train,y_train)
print("测试集的特征值和目标值",x_test,y_test)

3、估计器

四、模型评估指标

准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure

准确率是相对所有分类结果；精确率、召回率、F1-score是相对于某一个分类的预测评估标准。

详细介绍见：https://blog.csdn.net/u012879957/article/details/80564148 、

https://blog.csdn.net/houyanhua1/article/details/87968953?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase

api：

代码：

#精准率和召回率
    print("精准率和召回率：",classification_report(y_test,y_predict,target_names=news.target_names))