python之pd.DataFrame函数使用

原文链接:https://blog.csdn.net/linchunmian/article/details/80293251

在使用 pandas 的 DataFrame 方法时碰到的一个错误 ValueError: If using all scalar values, you must pass an index。

这是因为 pandas 的 DataFrame 方法需要传入一个可迭代的对象(列表,元组,字典等), 或者给 DataFrame 指定 index 参数就可以解决这个问题。如下:

 解决办法:

 一、关于DataFrame 的介绍

 DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表;DataFrame的单元格可以存放数值、字符串等,这和excel表很像,同时DataFrame可以设置列名columns与行名index。

二、创建DataFrame

1.1函数创建

    pandas常与numpy库一起使用,所以通常会一起引用

import pandas as pd
import numpy as np

df1 = pd.DataFrame(np.random.randn(3, 3), index=list('abc'), columns=list('ABC'))
print(df1)

          A         B         C
a  0.261756  1.955353 -0.412198
b  0.689325  0.177569 -1.530981
c -0.149398 -2.810199 -0.621954

  1.2直接创建

df4 = pd.DataFrame([[1, 2, 3],
                    [2, 3, 4],
                    [3, 4, 5]],
                   index=list('abc'), columns=list('ABC'))
print(df4)

#    A  B  C
# a  1  2  3
# b  2  3  4
# c  3  4  5

  1.3字典创建

dic1 = {
    'name': [
        '张三', '李四', '王二麻子', '小淘气'], 'age': [
            37, 30, 50, 16], 'gender': [
                '男', '男', '男', '女']}
df5 = pd.DataFrame(dic1)
print(df5)

   name  age gender
0    张三   37      男
1    李四   30      男
2  王二麻子   50      男
3   小淘气   16      女

  

二、DataFrame属性

2.1 查看列的数据类型

print(df5.dtypes)

# age        int64
# gender    object
# name      object
# dtype: object

2.2 查看DataFrame的头尾 

 

    使用head可以查看前几行的数据,默认的是前5行,不过也可以自己设置。

    使用tail可以查看后几行的数据,默认也是5行,参数可以自己设置。

    比如看前5行。
import pandas as pd
import numpy as np

df6 = pd.DataFrame(np.arange(36).reshape(6, 6), index=list('abcdef'), columns=list('ABCDEF'))
print(df6)
#     A   B   C   D   E   F
# a   0   1   2   3   4   5
# b   6   7   8   9  10  11
# c  12  13  14  15  16  17
# d  18  19  20  21  22  23
# e  24  25  26  27  28  29
# f  30  31  32  33  34  35

print(df6.head())
#     A   B   C   D   E   F
# a   0   1   2   3   4   5
# b   6   7   8   9  10  11
# c  12  13  14  15  16  17
# d  18  19  20  21  22  23
# e  24  25  26  27  28  29

  比如只看前2行

print(df6.head(2))

#    A  B  C  D   E   F
# a  0  1  2  3   4   5
# b  6  7  8  9  10  11

  

比如看后5行。
print(df6.tail())

#     A   B   C   D   E   F
# b   6   7   8   9  10  11
# c  12  13  14  15  16  17
# d  18  19  20  21  22  23
# e  24  25  26  27  28  29
# f  30  31  32  33  34  35


比如只看后2行。
print(df6.tail(2))

#     A   B   C   D   E   F
# e  24  25  26  27  28  29
# f  30  31  32  33  34  35

  

2.3 查看行名与列名

print(df6.index)
print(df6.columns)

# Index(['a', 'b', 'c', 'd', 'e', 'f'], dtype='object')
# Index(['A', 'B', 'C', 'D', 'E', 'F'], dtype='object')

  

 2.4 查看数据值

使用values可以查看DataFrame里的数据值,返回的是一个数组。
print(df6.values)

# [[ 0  1  2  3  4  5]
#  [ 6  7  8  9 10 11]
#  [12 13 14 15 16 17]
#  [18 19 20 21 22 23]
#  [24 25 26 27 28 29]
#  [30 31 32 33 34 35]]



比如说查看某一列所有的数据值。
print(df6['B'].values)

[ 1  7 13 19 25 31]

  

2.5 查看行列数

使用shape查看行列数,参数为0表示查看行数,参数为1表示查看列数
print(df6.shape[0])
print(df6.shape[1])

# 6
# 6

  

 2.6 切片与索引

使用冒号进行切片
print(df6['a':'b'])

#    A  B  C  D   E   F
# a  0  1  2  3   4   5
# b  6  7  8  9  10  11

print(df6.loc[:,'A':'B']) # A B # a 0 1 # b 6 7 # c 12 13 # d 18 19 # e 24 25 # f 30 31 #切片表示的是行切片 #索引表示的是列索引

  

3 DataFrame操作

3.1 转置

print(df6.T)

#    a   b   c   d   e   f
# A  0   6  12  18  24  30
# B  1   7  13  19  25  31
# C  2   8  14  20  26  32
# D  3   9  15  21  27  33
# E  4  10  16  22  28  34
# F  5  11  17  23  29  35

  

原文地址:https://www.cnblogs.com/mumianhuasayyes/p/15796957.html