过滤敏感词

该过滤敏感词汇方法,主要思路是遍历原文件,读取每行数据,查看是否存在敏感词,如果存在敏感词,替换为**,把修改后的内容的输出到临时文件中,即:不改变原有文件内容

当然也还有很多其他的方法,比如直接打印,或者源内容是字符串等,思路大概一致

#过滤敏感词汇
#读文件,输出带有敏感词汇进行*号替换
word_lib=['小白','小黑','小绿','小蓝','小红','小紫',] #敏感词汇

#过滤敏感词汇
def word_filter(word_lib,old_file,new_file):
    for i in old_file: #遍历原文件
        for j in word_lib: #遍历词汇库
            if j in i: #判断每行是否存在敏感词
               i=i.replace(j,'**') #对应存在的敏感词进行替换
        new_file.write(i) #敏感词替换的文件内容保存到临时文件
    close_file(old_file) #关闭文件
    close_file(new_file) #关闭文件

#打开文件
def open_file(filename,mode='r'): 
    result=open(filename,mode,encoding='utf-8')
    return  result #返回文件对象

#关闭文件
def close_file(file):
    file.close()

word_filter(word_lib,open_file('a.txt'),open_file('c.txt','w')) #调取过滤敏感词函数
原文地址:https://www.cnblogs.com/xiaokuangnvhai/p/11187235.html