python之爬虫

一、从网页爬下字符串清除特殊字符

import re

def validateTitle(title):
	rstr = r"[/\:*?"<>|	]"
	new_title = re.sub(rstr, "", title)
	return new_title

说明:如上函数用以过滤/:*?'<>| 以及table、空格(文件夹、文件名中也尽量不要使用空格)

  

原文地址:https://www.cnblogs.com/hester/p/5162465.html