python对excel统计分析
时间: 2023-07-05 09:13:16 浏览: 129
Python提供了多种库用于对Excel进行统计和分析,其中最常用的是pandas和openpyxl库。下面是一个简单的例子,演示如何使用这两个库进行Excel数据的读取、统计和分析。
首先,需要安装pandas和openpyxl库。可以使用以下命令来安装:
```
pip install pandas openpyxl
```
接下来,假设我们有一个名为“data.xlsx”的Excel文件,其中包含一张名为“Sheet1”的工作表,包含以下数据:
| Name | Age | Gender | Score |
|------|-----|--------|-------|
| Tom | 20 | Male | 90 |
| Jane | 22 | Female | 85 |
| Jack | 19 | Male | 95 |
| Lily | 21 | Female | 92 |
| John | 20 | Male | 88 |
现在,我们想要对这些数据进行统计和分析,例如计算平均分、最高分和最低分等。可以使用以下代码实现:
```python
import pandas as pd
# 读取Excel文件
df = pd.read_excel('data.xlsx', sheet_name='Sheet1')
# 计算平均分、最高分和最低分
mean_score = df['Score'].mean()
max_score = df['Score'].max()
min_score = df['Score'].min()
# 输出结果
print('平均分:', mean_score)
print('最高分:', max_score)
print('最低分:', min_score)
```
运行以上代码,输出结果如下:
```
平均分: 90.0
最高分: 95
最低分: 85
```
除了以上的基本统计分析,pandas还提供了许多其他的数据处理和分析功能,例如数据筛选、排序、分组、聚合等。如果想要深入了解,可以参考pandas的官方文档。
如果想要对Excel文件进行更复杂的操作,例如创建新的工作表、写入数据等,可以使用openpyxl库。以下是一个示例代码,演示如何使用openpyxl库创建一个新的工作表,并在其中写入数据:
```python
from openpyxl import Workbook
# 创建一个新的工作簿
wb = Workbook()
# 获取默认工作表
ws = wb.active
# 写入数据
ws['A1'] = 'Name'
ws['B1'] = 'Age'
ws['C1'] = 'Gender'
ws['D1'] = 'Score'
ws['A2'] = 'Tom'
ws['B2'] = 20
ws['C2'] = 'Male'
ws['D2'] = 90
ws['A3'] = 'Jane'
ws['B3'] = 22
ws['C3'] = 'Female'
ws['D3'] = 85
# 保存文件
wb.save('new_data.xlsx')
```
运行以上代码后,将会在当前目录下生成一个名为“new_data.xlsx”的文件,其中包含一个名为“Sheet”的工作表,包含以上写入的数据。如果想要对Excel文件进行更复杂的操作,可以参考openpyxl的官方文档。
阅读全文