2018.10.29

1.安装scipy,numpy,sklearn包

2. 从sklearn包自带的数据集中读出鸢尾花数据集data

from sklearn.datasets import load_iris
data =load_iris()

3.查看data类型,包含哪些数据

print('data类型' ,type(data))
print('data数据',data.keys())

4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型

iris_feature = data.feature_names,data.data
iris_category =data.target
print('鸢尾花特征',iris_feature)
print('鸢尾花特征(数据类型)',type(iris_feature))
print('鸢尾花类别数据',iris_category)
print('鸢尾花类别数据()',type(iris_category))

5.取出所有花的花萼长度(cm)的数据

sepal_length = np.array(list(len[0] for len in data.data ))
print('花萼长度:',sepal_length)

6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据

iris_petal =np.array(list(len[2]+len[3] for len in data.data))
print('花瓣长度+宽度:',iris_petal)

7.取出某朵花的四个特征及其类别。

print("特征:",data.data[20])
print("类别:",data.target[20])

 

8.将所有花的特征和类别分成三组,每组50个

iris_set = []
iris_ver = []
iris_vir = []

for i in range(0,150):      #分类
    if  data.target[i]==0:
            Data =data.data[i].tolist()
            Data.append('setosa')
            iris_set.append(Data)
    elif data.target[i]==1:
        Data=data.data[i].tolist()
        Data.append('versicolor')
        iris_ver.append(Data)
    else:
        Data=data.data[i].tolist()
        Data.append('virginica')
        iris_vir.append(Data)

9.生成新的数组,每个元素包含四个特征+类别

new_data=np.array([iris_set,iris_ver,iris_vir])
print('新数组',new_data)

10.计算鸢尾花花瓣长度的最大值,平均值,中值,均方差。

petal_len=np.array(list(len[2]  for len in data['data']))
#print(petal_len)
print(np.max(petal_len))
print(np.mean(petal_len))
print(np.median(petal_len))
print(np.std(petal_len))

 

11.显示鸢尾花某一特征的曲线图。

import matplotlib.pyplot as plt
plt.plot(np.linspace(0,150,num=150),data_len,'b')  #花瓣曲线图
plt.show()
plt.scatter(np.linspace(0,150,num=150),data_len,marker='o')#花瓣图
plt.show()

12.显示鸢尾花某一特征的散点图。

plt.scatter(np.linspace(0,150,num=150),petal_len,marker='o')#花瓣图
plt.show()

  

原文地址:https://www.cnblogs.com/czx98/p/9869532.html