使用图形用户界面实现。任意选择一个文本文件,分析该文件,如果存在敏感词汇,报告每个词出现的次数。敏感词汇保存在sentive.txt文件中,每个词占一行,至少设置10个敏感词汇。在用户界面中可以对敏感词汇进行管理,添加删除修改查询。 扩展:不限于文本文件,可以是word文件,也可以是网络中某一个网页
时间: 2023-12-10 11:41:46 浏览: 89
这是一个比较复杂的项目,需要涉及到文件读取、字符串匹配、用户界面设计等多个方面。下面是一个简单的实现过程:
1. 首先需要设计一个敏感词汇管理的界面,包括添加、删除、修改和查询功能。可以使用Python的Tkinter库来实现。
2. 在添加、删除、修改敏感词汇时,需要将这些词汇保存到sentive.txt文件中,可以使用Python的文件读写操作来实现。
3. 在进行敏感词汇分析时,需要读取要分析的文件(可以是文本文件或Word文件),并将其内容转化为字符串。
4. 然后逐个读取sentive.txt文件中的敏感词汇,并在要分析的字符串中进行匹配。可以使用Python的正则表达式来实现。
5. 如果匹配到了敏感词汇,则记录下该词汇出现的次数,并在用户界面中显示出来。
6. 最后,在用户关闭程序时,需要将修改过后的敏感词汇保存到sentive.txt文件中。
以上是一个简单的实现过程,具体的代码实现可以参考以下示例:
```python
import tkinter as tk
import re
class App:
def __init__(self, master):
self.master = master
self.sensitive_words = self.load_sensitive_words() # 加载敏感词汇列表
self.create_widgets()
def create_widgets(self):
tk.Label(self.master, text="敏感词汇管理").grid(row=0, column=0, padx=10, pady=5)
tk.Label(self.master, text="添加词汇:").grid(row=1, column=0, padx=10, pady=5)
tk.Label(self.master, text="删除词汇:").grid(row=2, column=0, padx=10, pady=5)
tk.Label(self.master, text="修改词汇:").grid(row=3, column=0, padx=10, pady=5)
tk.Label(self.master, text="查询词汇:").grid(row=4, column=0, padx=10, pady=5)
self.add_entry = tk.Entry(self.master)
self.del_entry = tk.Entry(self.master)
self.mod_entry = tk.Entry(self.master)
self.query_entry = tk.Entry(self.master)
self.add_entry.grid(row=1, column=1, padx=10, pady=5)
self.del_entry.grid(row=2, column=1, padx=10, pady=5)
self.mod_entry.grid(row=3, column=1, padx=10, pady=5)
self.query_entry.grid(row=4, column=1, padx=10, pady=5)
tk.Button(self.master, text="添加", command=self.add_sensitive_word).grid(row=1, column=2, padx=10, pady=5)
tk.Button(self.master, text="删除", command=self.del_sensitive_word).grid(row=2, column=2, padx=10, pady=5)
tk.Button(self.master, text="修改", command=self.mod_sensitive_word).grid(row=3, column=2, padx=10, pady=5)
tk.Button(self.master, text="查询", command=self.query_sensitive_word).grid(row=4, column=2, padx=10, pady=5)
tk.Label(self.master, text="敏感词汇分析").grid(row=5, column=0, padx=10, pady=5)
tk.Label(self.master, text="选择文件:").grid(row=6, column=0, padx=10, pady=5)
self.file_path = tk.Entry(self.master)
self.file_path.grid(row=6, column=1, padx=10, pady=5)
tk.Button(self.master, text="浏览", command=self.select_file).grid(row=6, column=2, padx=10, pady=5)
tk.Button(self.master, text="分析", command=self.analyze_file).grid(row=7, column=1, padx=10, pady=5)
self.result_text = tk.Text(self.master, width=60, height=20)
self.result_text.grid(row=8, column=0, columnspan=3, padx=10, pady=5)
def load_sensitive_words(self):
try:
with open("sensitive.txt", "r", encoding="utf-8") as f:
words = [line.strip() for line in f.readlines()]
except FileNotFoundError:
words = []
return words
def save_sensitive_words(self):
with open("sensitive.txt", "w", encoding="utf-8") as f:
for word in self.sensitive_words:
f.write(word + "\n")
def add_sensitive_word(self):
word = self.add_entry.get().strip()
if word and word not in self.sensitive_words:
self.sensitive_words.append(word)
self.add_entry.delete(0, "end")
self.save_sensitive_words()
def del_sensitive_word(self):
word = self.del_entry.get().strip()
if word and word in self.sensitive_words:
self.sensitive_words.remove(word)
self.del_entry.delete(0, "end")
self.save_sensitive_words()
def mod_sensitive_word(self):
old_word = self.mod_entry.get().strip()
new_word = self.add_entry.get().strip()
if old_word and new_word and old_word in self.sensitive_words:
index = self.sensitive_words.index(old_word)
self.sensitive_words[index] = new_word
self.mod_entry.delete(0, "end")
self.add_entry.delete(0, "end")
self.save_sensitive_words()
def query_sensitive_word(self):
word = self.query_entry.get().strip()
if word:
count = self.sensitive_words.count(word)
tk.messagebox.showinfo("查询结果", f"敏感词汇'{word}'共出现{count}次")
def select_file(self):
file_path = tk.filedialog.askopenfilename()
self.file_path.delete(0, "end")
self.file_path.insert(0, file_path)
def analyze_file(self):
file_path = self.file_path.get().strip()
if not file_path:
tk.messagebox.showerror("错误", "请选择要分析的文件")
return
try:
with open(file_path, "r", encoding="utf-8") as f:
content = f.read()
except FileNotFoundError:
tk.messagebox.showerror("错误", "文件不存在")
return
result = {}
for word in self.sensitive_words:
count = len(re.findall(word, content))
if count > 0:
result[word] = count
if not result:
tk.messagebox.showinfo("分析结果", "文件中未发现敏感词汇")
else:
self.result_text.delete("1.0", "end")
for word, count in result.items():
self.result_text.insert("end", f"{word}: {count}\n")
root = tk.Tk()
app = App(root)
root.mainloop()
```
可以看到,这个程序使用了Python的Tkinter库来实现用户界面,利用正则表达式进行字符串匹配,最终实现了对敏感词汇的管理和分析。在实际使用中,还需要考虑一些细节问题,比如文件编码、网络连接等方面的处理。
阅读全文