【pandas】数据去重

现在有一列数据，列名demo

该列中存在重复数据，现在要对数据去重

利用pandas的drop_duplicates方法，subset指列名，keep指只保留遇到的第1个结果

import pandas as pd
data={'demo':[1,1,2,2,1,2,2,3,4,5,6,98,4,2,4,5,2,5,6,7]}
df=pd.DataFrame(data)

a=df.drop_duplicates(subset=['demo'],keep='first')
print(a)

效果：

demo列中重复的数据就已经没有了

参考文档：

pandas 筛选去除重复的数据

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/kaerxifa/p/12909580.html

推荐文章
CLion之C++框架篇-优化框架，单元测试（二）
CLion之C++框架篇-安装工具，基础框架的搭建（一）
人物关系挖掘方案设计
上海邮政EMS海关清关（个人）流程
10年了，用园子里面的功能写写东西
selenium 常见面试题以及答案（Java版）
2016年学习计划
终于遇到app不兼容，你遇到了么？
使用httpclient 调用selenium webdriver
testng 失败自动截图
selenium测试框架使用xml作为对象库
appium 滑动
Appium 三种wait方法（appium 学习之改造轮子）
appium实现截图和清空EditText
appium 自动化测试之知乎Android客户端
selenium 测试框架中使用grid
appium java 环境搭建
selenium测试框架篇，页面对象和元素对象的管理
Selenium FF WebDriver 加载firebug 和设置代理
selenium webdriver 右键另存为下载文件（结合robot and autoIt）
selenium 下载百度音乐并验证
selenium web driver 实现截图功能
selenium web driver 使用JS修改input属性
.net测试学习--理解.net测试选项
试水STF（smartphone test farm）
The difference between QA, QC, and Test Engineering
selenium 3.0 beta2 初体验
Gson解析纯Json数组
Android带图片的Toast（自定义Toast）
Android issues