In [1]:
import pandas as pd
import numpy as np
s=pd.Series(['A','b','B','gaer','AGER',np.nan])
s
Out[1]:
1.大小写转换
In [2]:
s.str.lower()#大写转小写
Out[2]:
In [3]:
s.str.upper()#小写转大写
Out[3]:
2.计算字符串的长度
In [4]:
s.str.len()
Out[4]:
3.删除字符串里的空格
In [5]:
index=pd.Index([' tang ',' yu ',' di '])
index
Out[5]:
In [6]:
index.str.strip()#删除字符串里的空格
Out[6]:
In [7]:
index.str.lstrip()#删除左边空格
Out[7]:
In [8]:
index.str.rstrip()#删除右边空格
Out[8]:
4.改变DataFrame名称
In [9]:
df=pd.DataFrame(np.random.randn(3,2),columns=['A a','B b'],index=range(3))
df
Out[9]:
In [10]:
df.columns=df.columns.str.replace(' ','_')#空格替换成 "_"
df
Out[10]:
5.用分隔符删除
In [11]:
s=pd.Series(['a_b_C','c_d_e','f_g_h'])
s
Out[11]:
In [12]:
s.str.split('_')#用分隔符删除,变成list结构
Out[12]:
6.切分数据
In [13]:
s.str.split('_',expand=True)#把数据全部分开
Out[13]:
In [14]:
s.str.split('_',expand=True,n=1)#把数据切分一次
Out[14]:
In [15]:
s.str.split('_',expand=True,n=2)#把数据切分两次
Out[15]:
In [16]:
s=pd.Series(['A','Aas','Asjfds','Ajdd','Adhee'])
s
Out[16]:
In [17]:
s.str.contains('Aa')#判断Aa 是否存在
Out[17]:
7.查询分隔符的位置
In [18]:
s=pd.Series(['a','a|b','a|c'])
s
Out[18]:
In [19]:
s.str.get_dummies(sep='|')#查询分隔符的位置
Out[19]: