python学习第十五节(正则)

正则的贪婪匹配

非贪婪模式按照最小重复数取

非贪婪匹配

正则的方法

re.split 正则分割

分割次数

保留分隔符,用一个括号套住分隔符

sub 替换字符串
需要三个参数,要替换的内容(正则),新内容,字符串

分开写用compile
可以写一次规则
然后多次匹配,好处就是方便灵活。

返回一个迭代器对象

爬虫爬豆瓣电影信息,用正则

模块 configparser
功能:创建成下面类型的文件

使用方法

读操作

DEFAULT是默认信息,不需要打印,默认信息是所有段落信息的共享信息。

用上图方法判断字段是否在文件内

如上图取值,取出文件内的内容,字典里的字典的键

subprocess模块
调用的时候新生成一个进程

linux环境不需要加shell=True,除非命令是个组合命令

原文地址:https://www.cnblogs.com/ArmoredTitan/p/7116998.html