用python做一款软件用于分析excel中的数据
时间: 2023-10-03 16:02:20 浏览: 97
python实现Excel数据分析
好的,下面我将为你介绍如何用 Python 实现这个软件。
首先,我们需要安装一些必要的 Python 库,包括 pandas、openpyxl、tkinter 和 matplotlib。你可以使用以下命令来安装这些库:
```python
pip install pandas openpyxl tkinter matplotlib
```
接下来,我们需要编写 Python 代码来实现数据分析的功能。以下是一个简单的代码示例:
```python
import tkinter as tk
from tkinter import filedialog
import pandas as pd
import matplotlib.pyplot as plt
# 定义分数段
score_ranges = [
{"name": ">=90", "min": 90, "max": 100},
{"name": ">=80 and <90", "min": 80, "max": 90},
{"name": ">=70 and <80", "min": 70, "max": 80},
{"name": ">=60 and <70", "min": 60, "max": 70},
{"name": "<60", "min": 0, "max": 60},
]
# 定义 GUI 界面
class Application(tk.Frame):
def __init__(self, master=None):
super().__init__(master)
self.master = master
self.pack()
self.create_widgets()
def create_widgets(self):
# 选择文件按钮
self.choose_file_button = tk.Button(self)
self.choose_file_button["text"] = "选择文件"
self.choose_file_button["command"] = self.choose_file
self.choose_file_button.pack(side="top")
# 选择数据类型按钮
self.choose_type_button = tk.Button(self)
self.choose_type_button["text"] = "选择数据类型"
self.choose_type_button["command"] = self.choose_type
self.choose_type_button.pack(side="top")
# 分段显示结果的表格
self.result_table = tk.Text(self)
self.result_table.pack(side="top")
# 保存结果按钮
self.save_button = tk.Button(self)
self.save_button["text"] = "保存结果"
self.save_button["command"] = self.save_result
self.save_button.pack(side="top")
def choose_file(self):
# 弹出文件选择对话框
filename = filedialog.askopenfilename()
if filename:
self.filename = filename
self.choose_file_button["text"] = "已选择文件:" + filename
# 读取 Excel 文件
self.df = pd.read_excel(filename)
def choose_type(self):
# 弹出数据类型选择对话框
self.data_type = tk.simpledialog.askstring("选择数据类型", "请输入数据类型(期末成绩或者总成绩)")
if self.data_type:
self.choose_type_button["text"] = "已选择数据类型:" + self.data_type
# 统计分数段的学生人数和占比情况
self.count_result = {}
total_count = len(self.df)
for score_range in score_ranges:
count = len(self.df[(self.df[self.data_type] >= score_range["min"]) & (self.df[self.data_type] < score_range["max"])])
ratio = count / total_count
self.count_result[score_range["name"]] = {"count": count, "ratio": ratio}
# 显示结果
self.show_result()
def show_result(self):
# 清空结果表格
self.result_table.delete("1.0", tk.END)
# 在结果表格中显示分数段的学生人数和占比情况
self.result_table.insert(tk.END, "分数段\t人数\t占比\n")
for score_range in score_ranges:
count = self.count_result[score_range["name"]]["count"]
ratio = self.count_result[score_range["name"]]["ratio"]
self.result_table.insert(tk.END, "{}\t{}\t{:.2f}%\n".format(score_range["name"], count, ratio * 100))
# 绘制饼图
labels = [score_range["name"] for score_range in score_ranges]
counts = [self.count_result[score_range["name"]]["count"] for score_range in score_ranges]
plt.pie(counts, labels=labels)
plt.show()
def save_result(self):
# 弹出保存文件对话框
filename = filedialog.asksaveasfilename(defaultextension=".csv")
if filename:
# 将统计结果保存到 CSV 文件中
df = pd.DataFrame.from_dict(self.count_result, orient="index", columns=["count", "ratio"])
df.to_csv(filename)
# 创建 GUI 界面并运行程序
root = tk.Tk()
app = Application(master=root)
app.mainloop()
```
以上代码实现了一个简单的 GUI 界面,用户可以通过界面选择要分析的 Excel 文件和数据类型(期末成绩或者总成绩),然后显示每个分数段的学生人数和占比情况,并绘制饼图。用户还可以将统计结果保存到 CSV 文件中。
这只是一个简单的示例代码,你可以根据自己的需求进行修改和扩展。希望能对你有所帮助!
阅读全文