第六次作业———numpy数据集练习

1. 安装scipy，numpy，sklearn包

2. 从sklearn包自带的数据集中读出鸢尾花数据集data

3.查看data类型，包含哪些数据

4.取出鸢尾花特征和鸢尾花类别数据，查看其形状及数据类型

5.取出所有花的花萼长度(cm)的数据

6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据

7.取出某朵花的四个特征及其类别。

8.将所有花的特征和类别分成三组，每组50个

9.生成新的数组，每个元素包含四个特征+类别

10.计算鸢尾花花瓣长度的最大值，平均值，中值，均方差。

11.显示鸢尾花某一特征的曲线图，散点图。


#导入nampy 导入鸢尾花数据
import numpy as np
from sklearn.datasets import load_iris

#从sklearn包自带的数据集中读出鸢尾花数据集data
from sklearn.datasets import load_iris
data = load_iris()
#查看data类型，包含哪些数据
print("数据类型：",type(data))
print("数据类目：",data.keys())
#取出鸢尾花特征和鸢尾花类别数据，查看其形状及数据类型
iris_feature = data.feature_names,data.data
print("鸢尾花特征：",iris_feature)
print("iris_feature数据类型",type(iris_feature))
iris_target = data.target
print("鸢尾花数据类别：",iris_target)
print("iris_target数据类型：",type(iris_target))
#取出所有花的花萼长度数据
sepal_len = np.array(list(len[0] for len in data.data))
print("花萼长度：",sepal_len)
#取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据
petal_length = np.array(list(len[2] for len in data['data']))
petal_length.resize(15,10)
petal_width = np.array(list(len[3] for len in data['data']))
petal_width.resize(15,10)
iris_lens = (petal_length,petal_width)
print('所有花瓣的长度+宽度是：',iris_lens)
#取出某朵花的四个特征及其类别
print("特征：",data.data[1])
print("类别：",data.target[1])
#将所有花的特征和类别分成三组，每组50个
iris_set = []
iris_ver = []
iris_vir = []    #定义三个列表来存放不同类型花朵的类别

for i in range(0, 150):
    if data.target[i] == 0:
        Data = data.data[i].tolist()
        Data.append('setosa')
        iris_set.append(Data)
    elif data.target[i] == 1:
        Data = data.data[i].tolist()
        Data.append('versicolor')
        iris_ver.append(Data)
    else:
        Data = data.data[i].tolist()
        Data.append('virginica')
        iris_vir.append(Data)
#生成新的数组，每个元素包含四个特征+类别
datas = (iris_set,iris_ver,iris_vir)
print("新的数组：",datas)

运行结果