栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Python敏感词汇检测

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python敏感词汇检测

只要思想不滑坡,办法总比困难多

昨天在写练习题的时候写到这点特别迷,一直绕不过这个弯,最后也算是成功实现吧,记录一下,防止下次再绕的出不来。

之前访问的的Github镜像站一直触发滥用检测机制,着实很烦人。

代码实现过程

  1. 编写敏感词词汇文件 filtered_words.txt

    假设文件有四个敏感词汇,当输入的信息包含文件中的词汇时,进行替换
  2. 接受键盘输入,读取 filtered_words.txt 文件内容
words = input("请输入要检测的词语>>")
file_path = r'./assist/filtered_words.txt'  # 文件保存路径
with open(file_path, 'r') as f:
    # f.read() 原始格式为字符串
    z = "".join(f.read()).split("n")  #将文本内件内容以换行符为界,转换为列表

注意,应该将词汇整体转换为一个列表对象,而不是逐字转换

z 的格式及内容

  1. 通过遍历列表 z,判断列表中的元素是否在 words 中,如果存在则转换为 len(z[i]) 长度的 *
for i in range(0, len(z)):
    if z[i] in words:
        words = words.replace(z[i], "*" * len(z[i]))

单独的‘北’和‘程序’并没有被装换

7. 综上,我认为程序功能已经实现,刚开始一直绕不出来的地方主要就在于字符串格式的转换,要不就是无法输出,要不就是逐字检测,要不就是单字逐行输出
若有纰漏,错误,不足之处,烦请不吝指正

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/302288.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号