Python清除常见的网页空格格式

def clean(string):
pattern = re.compile(r'<[^>]+>', re.S)
string = pattern.sub('', string)
string = string.replace(' ', ' ').replace(' ', ' ').replace('&nbsp;', ' ').replace(' ', ' ').replace(" ",'')
string = string.strip()
return string
原文地址:https://www.cnblogs.com/yp19970/p/12743741.html