去重与替换

# 去重 duplicated()

s = pd.Series([1,1,1,1,2,2,2,3,4,5,5,5,5,5])
print(s[s.duplicated()==False])
 
out:      0    1
          4    2
          7    3
          8    4
          9    5
          dtype: int64        
# 移除重复值,默认inplace为False,生成新数据。 True则直接修改原数据。
s.drop_duplicates(inplace=True)
print(s)
# 替换 replace

s =pd.Series(list('ascaazsd'))
print(s)
print(s.replace(['a','s'],np.nan))
print(s.replace({'a':'hello','s':123})) # 多值,可以使用字典的形式的。
原文地址:https://www.cnblogs.com/parsonbf/p/12839292.html