匹配汉字或者数字 正则

strinfo=re.compile(r'([u4e00-u9fa5]|[d])')
df['label']=df['data'].apply(lambda x:strinfo.sub('',x))


strip_=re.compile(r'([,]|[。]|[:]|[、])')
括号里面的符号不需要再加引号了



原文地址:https://www.cnblogs.com/jfdwd/p/11458331.html