python提取excel中的数据
时间: 2023-05-26 16:06:53 浏览: 89
实现这个任务可以使用Python的pandas和openpyxl库。
首先用pandas库中的read_excel方法读取Excel文件,并存储为Dataframe对象。
```python
import pandas as pd
df = pd.read_excel('filename.xlsx')
```
接下来可以通过Dataframe对象的各种方法,获取需要的数据。例如,可以使用loc方法按索引或标签来获取具体的单元格或行列数据。
```python
# 获取第一行
first_row = df.loc[0]
# 获取第一列
first_column = df.loc[:, 'column_name']
```
也可以通过条件筛选、排序和分组等方法来处理数据。例如,可以使用query方法根据条件提取数据。
```python
# 根据某个条件筛选数据
filtered_data = df.query('column_name > 10')
# 按某个列排序
sorted_data = df.sort_values(by='column_name')
# 按某个列分组
grouped_data = df.groupby('column_name')
```
最后,可以使用openpyxl库将提取的数据写入新的Excel文件,以便进一步处理。
```python
from openpyxl import Workbook
# 新建工作表并写入数据
wb = Workbook()
ws = wb.active
ws.append(['column1', 'column2'])
ws.append([1, 2])
ws.append([3, 4])
# 保存工作表
wb.save('new_file.xlsx')
```