[学习记录]sklearn线性回归

本文旨在记录colin老师workshop的exercise1讲解,包含入门级的sklearn操作

首先导入库

import numpy as np
import pandas as pd
import scipy.stas as stats
import sklearn

其次导入数据,这里使用的是sklearn中内置的数据集

from sklearn.datasets import load_boston
boston=load_boston()

使用pandas整理数据

pandas可以用来求相关性,取值为-1~1之间,-1为负相关,1为正相关,靠近0则是不相关。其中如果相关性低于0.5则应该考虑换一个参考模型。

 进行线性回归训练

对照测试集进行检验,检验的时候有三个重要指标,三个指标均越小越好

MAE:mean absolute error,预测时发生的平均偏差,取绝对值

MSE:mean squared error,对预测时产生的偏差进行平方处理,导致错误重度惩罚,正确轻度奖励

RMSE:root mean squared error,相当于对MSE结果开平方根

之前介绍的模型是一个自变量一个因变量,也支持多个自变量,就结果来看该模型不如上一个准确

原文地址:https://www.cnblogs.com/trickofjoker/p/9305455.html