pandas 数据处理入门

  1. pandas的安装
    pip install pandas
  2. 导入pandans
    import pandas as pd    #为了方便使用pandas  采用pd简写
  3. pandas的初体验 (使用DataFrame和Series)
    #DataFrame 是一种二维数据结构,可以在列中存储不同类型的数据
    #手动将数据存储在表中,创建DataFrame
    #使用python的列表字典时,字典键将用作标题,而每个列表中的值用作DataFrame
    import pandas as pd  #导包
    df = pd.DataFrame({
        'Name':['徐欣','张德阳','韩磊'],
        'Age':[22,30,29],
        'Sex':['male','male','male']
    })
    print(df)
    
    #结果为:
    '''
      Name  Age   Sex
    0   徐欣   22  male
    1  张德阳   30  male
    2   韩磊   29  male
    '''
    
    #爬取某一类数据
    print(df['Name'])
    print(df.get('Age'))   #两种方法,根据python字典的特性
    
    #查询表中同学的最大年龄
    print(df['Age'].max())
    
    # 查询数据表中数值数据的基本统计信息
    print(df.describe())
    #a中的每一列DataFrame都是一个Series
    
    #上述例子也可以从头开始创建,Series没有列标签,因为它只是单列的DataFrame,系统只具有行标签
    #这种方法我不怎么喜欢,相对来说较麻烦,单列的,如果创建多个比较麻烦,而DataFrame是多行多列
    import pandas as pd  #导包
    ages = pd.Series([22,35,58],name='Age')
    print(ages)
    '''
    结果为:
    0    22
    1    35
    2    58
    Name: Age, dtype: int64
    '''
    
    #查询表中同学最大的年龄
    print(ages.max())

    

原文地址:https://www.cnblogs.com/u-damowang1/p/13575508.html