pandas删除及其映射修改操作。

1.使用drop_duplicates()函数删除重复的行

df.drop_duplicates() 

 2.映射

映射的含义,创建一个映射关系,把values元素和一个特定的标签或字符串绑定

map = {"label1":"value1","label2":"value2","label3":"value3"}

包含三种操作:

           replace()函数:替换元素

           最重要:map()函数:新建一列

           rename()函数:替换索引

replace()

# 适应replace()函数,对values进行替换操作。

replace()对应参数有:

['to_replace=None', 'value=None', 'inplace=False', 'limit=None', 'regex=False', "method='pad'"]

 在原数据的基础上对数据通过隐射的方式进行修改

如:df.replace({4:60,1:60},inplace=True)

map()

map()新建一列,是指使用原有的列生成一个新的列,适合处理某一单独的数据,任然是一个字典

map()函数中适合使用lambda函数或是重新定义一个函数。

map()也可以使用自定义的映射函数对values的某一列进行重新赋值。

扩展:transform()和map()类似的

           apply和map类似

如:

def convert(x):
if x<60:
return "不及格"
elif x>=60 and x<80:
return "及格"
elif x>=80 and x<100:
return "一般"
elif x>=100 and x<120:
return "良好"
else:
return "优秀"
df["level"] = df["python"].map(convert)
df

3.rename()

rename()函数:替换索引

任然是新建的一个字典的映射关系

如:使用rename()函数替换索引

df.rename({0:"a",3:"B"})   #替换行索引

#替换列索引

df.rename({"math":"java"},axis=1)

原文地址:https://www.cnblogs.com/kuangkuangduangduang/p/10273908.html