import os import tkinter as tk from tkinter import filedialog, messagebox from pdfminer.high_level import extract_text root = tk.Tk() root.title("PDF文档信息搜索") def browse_file(): file_path = filedialog.askopenfilename() if file_path: file_entry.delete(0, tk.END) file_entry.insert(0, file_path) def search(): file_path = file_entry.get() keyword = keyword_entry.get() if not os.path.exists(file_path): messagebox.showerror("错误", "文件不存在") return try: text = extract_text(file_path) if keyword in text: result_text.delete("1.0", tk.END) result_text.insert(tk.END, text) else: messagebox.showinfo("提示", "未找到关键词") except: messagebox.showerror("错误", "提取文本信息时出错") file_label = tk.Label(root, text="选择文件:") file_label.grid(row=0, column=0, padx=5, pady=5, sticky="e") file_entry = tk.Entry(root, width=50) file_entry.grid(row=0, column=1, padx=5, pady=5) file_button = tk.Button(root, text="浏览", command=browse_file) file_button.grid(row=0, column=2, padx=5, pady=5) keyword_label = tk.Label(root, text="搜索关键词:") keyword_label.grid(row=1, column=0, padx=5, pady=5, sticky="e") keyword_entry = tk.Entry(root, width=50) keyword_entry.grid(row=1, column=1, padx=5, pady=5) search_button = tk.Button(root, text="搜索", command=search) search_button.grid(row=2, column=1, padx=5, pady=5) result_label = tk.Label(root, text="搜索结果:") result_label.grid(row=3, column=0, padx=5, pady=5, sticky="e") result_text = tk.Text(root, width=80, height=20) result_text.grid(row=4, column=0, columnspan=3, padx=5, pady=5) root.mainloop()上述代码使用paddleNLP技术来提取
时间: 2023-07-15 13:14:04 浏览: 109
PDF文档中的文本信息,并且允许用户输入关键词进行搜索。如果找到了匹配关键词的文本,则会在程序界面上显示搜索结果。如果没有找到,则会弹出提示框告知用户。
需要注意的是,这段代码中并没有使用PaddleNLP技术来提取PDF文档中的文本信息,而是使用了pdfminer库中的extract_text函数来实现。PaddleNLP是一个自然语言处理工具包,与PDF文档解析并提取文本信息的功能没有直接关联。
相关问题
import pandas as pd import csv import matplotlib.pyplot as plt import tkinter as tk from PIL import Image, ImageTk from tkinter import filedialog from matplotlib.backends.backend_tkagg import FigureCanvasTkAgg from tkinter import Tk, Button, Text, filedialog, messagebox from sklearn.preprocessing import StandardScaler,LabelEncoder from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression from sklearn.tree import DecisionTreeRegressor from sklearn.ensemble import RandomForestRegressor解释每一句代码的含义
这段代码是导入Python中的一些常用数据处理和机器学习库,并且实现了一些具体的功能。
- `import pandas as pd`: 导入pandas库并使用pd作为别名,pandas是一个数据处理库,可以对表格数据进行读取、清洗、转换等操作。
- `import csv`: 导入csv库,csv是一种常用的表格数据格式,可以用于读取和写入csv文件。
- `import matplotlib.pyplot as plt`: 导入matplotlib库,并使用plt作为别名,matplotlib是一个绘图库,可以用于绘制各种图形、图表等。
- `import tkinter as tk`: 导入tkinter库,并使用tk作为别名,tkinter是Python的标准GUI库,可以用于创建各种用户界面。
- `from PIL import Image, ImageTk`: 导入PIL库中的Image和ImageTk模块,PIL是一个图像处理库,可以用于读取、处理和保存各种图像格式。
- `from tkinter import filedialog`: 从tkinter库中导入filedialog模块,filedialog是一个用于打开和保存文件对话框的模块。
- `from matplotlib.backends.backend_tkagg import FigureCanvasTkAgg`: 从matplotlib库中导入FigureCanvasTkAgg模块,可以用于在Tkinter界面中绘制matplotlib图形。
- `from tkinter import Tk, Button, Text, filedialog, messagebox`: 从tkinter库中导入Tk、Button、Text、filedialog和messagebox等模块,用于创建各种界面控件和显示消息框。
- `from sklearn.preprocessing import StandardScaler,LabelEncoder`: 从sklearn库中导入StandardScaler和LabelEncoder模块,用于数据预处理,如特征缩放和标签编码等。
- `from sklearn.model_selection import train_test_split`: 从sklearn库中导入train_test_split模块,用于将数据集划分为训练集和测试集。
- `from sklearn.linear_model import LinearRegression`: 从sklearn库中导入LinearRegression模块,用于线性回归分析。
- `from sklearn.tree import DecisionTreeRegressor`: 从sklearn库中导入DecisionTreeRegressor模块,用于决策树回归分析。
- `from sklearn.ensemble import RandomForestRegressor`: 从sklearn库中导入RandomForestRegressor模块,用于随机森林回归分析。
下列代码中,文本框能显示,其它控件如notebook都不能显示。请给出修改后的代码。import tkinter as tk import tkinter.font as tkFont from tkinter.scrolledtext import ScrolledText # 导入ScrolledText from tkinter.filedialog import * from tkinter.ttk import * from tkinter import * import tkinter.messagebox from pystray import MenuItem, Menu from PIL import Image import pandas as pd class tkinterGUI(): root = None # 定义为类属性,可以在类的多个实例中共享 def __init__(self, geometry): pass def test(self): pass def create_root_win(self): self.root, self.文本框_主消息 = self.create_toplevel_win(True, "软件标题", "430x670", self.test, False, False) self.root.mainloop() # 在 create_root_win 方法中调用 mainloop 方法,显示窗口 def root_win_add1(self): if self.root is None: self.create_root_win() self.文本框_主消息.insert("1.0","efdssfdadsfasf") # 主内容区域 notebook = Notebook(self.root) notebook.pack(fill=tk.BOTH, expand=True) def create_toplevel_win(self,if_root,title,size,close_cmd,textbox_n,if_resize_width=True,if_resize_heigh=True): if if_root: mygui=tk.Tk() else: mygui=tk.Toplevel(self.root) 窗口win启动 = True mygui.title = title mygui.protocol('WM_DELETE_WINDOW', close_cmd) # 把点击x关闭窗口变成不要关闭并最小化到托盘 # 设置大小 居中展示 #win.bind("<Configure>", lambda root:win_mouse_release(root)) mygui.resizable(width=if_resize_width, height=if_resize_heigh) mygui.wm_attributes('-topmost', 1) #mygui.geometry(size+ "+" + str(self.root.winfo_x() + self.root.winfo_width()) + "+" + str(self.root.winfo_y())) mygui.geometry(size) tbox = ScrolledText(mygui) #self.eval("文本框"+title) = ScrolledText(self.win) tbox.place(relx=0.01, rely=0.18, relwidth=0.99, relheight=0.8) mygui.mainloop() return mygui,tbox # a,b=400,650 def show_msg_in_toplevel(self): self.win_msg,self.win_msg_tb= self.create_toplevel_win(self.root,"实时解盘","350x670",self.隐藏到任务栏,False,False) if __name__=="__main__": root=tkinterGUI("360x670") root.root_win_add1()
可能是因为notebook控件没有被正确地添加到窗口中。以下是修改后的代码:
import tkinter as tk
import tkinter.font as tkFont
from tkinter.scrolledtext import ScrolledText
root = tk.Tk()
# 创建notebook控件
notebook = tk.ttk.Notebook(root)
# 创建文本框控件
text = ScrolledText(root)
# 将文本框添加到notebook中
notebook.add(text, text="文本框")
# 将notebook添加到窗口中
notebook.pack(expand=True, fill="both")
root.mainloop()
阅读全文