第十周学习进度

这周学习了鸢尾花算法

构建模型后,在需要使用模型进行预测前,需要验证模型是否有效,就需要有验证模型的数据集。
数据分割:把数据分为训练集和测试集
scikit-learn的train_test_split函数可以打乱数据集并进行拆分。这个函数将75%的行数据及对应标签(样本)作为训练集,剩下的25%作为测试集。
数据的打乱是利用伪随机数生成器实现的,需要指定参数random_state指定随机数生成器的种子。它为0时,不管运行多少次,函数的输出固定不变。

原文地址:https://www.cnblogs.com/wyppaa/p/14941152.html