关于pandas的一些笔记

 1 import pandas as pd
 2 import numpy as np
 3 
 4 df = pd.read_csv('./dogname/dogNames2.csv')
 5 df = df.head(10)
 6 print(df)
 7 #print(df.loc[1, 'Row_Labels']) #取行索引为1,列索引为Row_Labels的数据
 8 t1 = df.loc[[1,2],]  #取第一行和第二行,等价于df.loc[[1,2],:]
 9 t2 = df.loc[[1,2], ['Row_Labels','Count_AnimalName']] #取块
10 t3 = df.iloc[:,1]         #取第一列的数据
11 t4 = df.iloc[[8,9], 1]   #取第8行和第9行的第1列数据
12 t5 = df[(df['Count_AnimalName']>2)&(df['Count_AnimalName']<50)] #布尔值为索引
13 t6 = df[(df['Row_Labels'].str.len()>5)&(df['Count_AnimalName']>2)]#取Row_Labels字符串长度大于5且Count_AnimalName大于2的数据

pands取行或者列的注意点
1、方括号写数组,表示取行,对行进行操作 df[:20]
2、写字符串,表示的取列索引,对列进行操作 df['Row_Labels']
3、df[:100]['Row_Labels']表示先取前100行,再去Row_Labels这列的元素
4、df.loc通过行标签取行数据,df.iloc通过行索引获取行数据。标签和索引有区别,索引只能为数字(0,1,2,3...),标签可以为任意(例如:a,b,c,d...)

--------------------成功,肯定是需要一点一滴积累的--------------------
原文地址:https://www.cnblogs.com/GouQ/p/12599263.html