鸢尾花的读取数据和数据探索

一：读取数据

import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets


iris = datasets.load_iris()

print(type(iris))
#<class 'sklearn.utils.Bunch'> 和字典类型一样

print(iris.keys())
#包括5个key，dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names'])

#分别打印下
print(iris.data)#打印数据
print(iris.target)#打印最后的标记，包括0，1，2
print(iris.target_names)#打印最后的特征值的名称
print(iris.DESCR)#打印描述信息
print(iris.feature_names)#打印样本的特征名称

二：数据探索

data = iris.data

x = data[:,:2] #取前两列
plt.scatter(x[:,0],x[:,1])
plt.show()

#查看下每种花鄂片的分布情况
target = iris.target
plt.scatter(x[target==0,0],x[target==0,1])
plt.scatter(x[target==1,0],x[target==1,1])
plt.scatter(x[target==2,0],x[target==2,1])
plt.show()

#查看下每种花的花瓣分布情况
x = data[:,2:]
plt.scatter(x[target==0,0],x[target==0,1])
plt.scatter(x[target==1,0],x[target==1,1])
plt.scatter(x[target==2,0],x[target==2,1])
plt.show()