pandas处理数据

读文件

pd.read_csv('path/to/file.txt',header=0,names='ab',index=0)
names Columns这个可以不写,制定索引列是第一列,这样就没有序号

写文件

np.tofile("d:/python/np.txt")

dataframe

类似于二维列表
充分利用map函数
df.a=df.a.map(function)
修改一列的值

筛选列

new_dataframe = df[df.a!='']
这种办法可以筛选得到新的df
自动迭代

处理

def getPhoneNumFromFile(fobj):
regex = re.compile(r'1d{10}', re.IGNORECASE)
phonenums = re.findall(regex, fobj)
#print phonenums
if len(phonenums)==1:
return phonenums[0]
else:
return ''

原文地址:https://www.cnblogs.com/asworm/p/5535809.html