python3下应用pymysql(第三卷)(数据自增-用于爬虫)

在上卷中我说出两种方法进行数据去重自增,第一种就是在数据库的字段中设置唯一字段,二是在脚本语言中设置重复判断再添加(建议,二者同时使用,真正开发中就会用到)

话不多说先上代码

第一步:

确定那一字段的数据为不可重复数据,我在这个测试表中希望worknum的数据为不可重复数据,现在看下表中数据:

第二步:

测试查询语句:

可以看出查询语句以字符串的形式存在于方法中结果如下:

可以看出数据可以正常查询

第三步:

模拟数据演练,进行判断

我在1处做了组测试数据,可以看到list1里的worknum数据在数据表中已经存在,在2处进行判断,如果存在则告知数据,已存在,否则插入数据,由于LIST1中数据存在所以打印结果如下:

没有新数据添加进来

现在我改一下list1的内容

我改了下worknum的值,结果如下:

 数据表内增加了新的值,依此类推到数据自增,爬虫的时候如何拒绝爬取重复数据,明白了吧

原文地址:https://www.cnblogs.com/woshiruge/p/8310367.html