pandas如何循环遍历表格里的所有sheet数据
时间: 2024-03-02 13:50:26 浏览: 199
在 Pandas 中,可以使用 `pd.read_excel()` 函数读取 Excel 文件,并使用 `sheet_name=None` 参数来读取所有的工作表,然后将它们存储在一个字典中,其中字典的键为工作表的名称,字典的值为 Pandas DataFrame 对象。
以下是一个循环遍历表格里的所有 sheet 数据的示例代码:
```python
import pandas as pd
# 读取 Excel 文件,将所有 sheet 存储在字典中
excel_file = pd.read_excel('file.xlsx', sheet_name=None)
# 遍历所有的 sheet
for sheet_name, sheet_data in excel_file.items():
print(f"Sheet Name: {sheet_name}")
print(sheet_data.head()) # 显示每个 sheet 的前五行数据
```
在这个示例代码中,我们首先使用 `pd.read_excel()` 函数读取名为 `file.xlsx` 的 Excel 文件,并将所有的工作表存储在一个字典中。然后,我们使用 `for` 循环遍历字典中的每个工作表,打印每个工作表的名称,并使用 `head()` 函数显示每个工作表的前五行数据。
相关问题
python 使用pandas库,使用 pandas 库中的 read_excel 函数和 MultiIndex 类型来读取合并单元格表头,操作excel文件“data\推送名单.xlsx”,遍历循环读取所有sheet表,读取表头“接收人工号”的所在列数据data1和读取合并单元格表头“推送内容”的所在的合并列的所有数据data2(示列:B列,C列,D列的第一行是合并单元格,是‘推送内容’表头),合并data1,data2为一个总数据data,定义一个字典dictext,定义一个字符串strtext,对data做遍历循环,其中包含的data1表头“接收人工号”的列单元格数据为字典的key值,其中包含的data2的表头为“推送内容”的合并列数据做字符串拼接strtext(表头为“推送内容”的合并列的单元格数据有转行,有特殊符号),strtext做字典的value值,每行遍历都重置strtext 相关所有代码
以下是您所需的代码:
```python
import pandas as pd
# 读取 Excel 文件中的所有表格
xls = pd.ExcelFile('data/推送名单.xlsx')
# 定义一个空 DataFrame 存放所有表格数据
data = pd.DataFrame()
# 遍历所有表格
for sheet_name in xls.sheet_names:
# 读取表格数据,跳过前两行
df = pd.read_excel(xls, sheet_name, header=2)
# 读取表头为“接收人工号”的列单元格数据
data1 = df['接收人工号']
# 读取表头为“推送内容”的合并列的所有数据,合并为一个 Series
data2 = pd.concat([df.iloc[:, i] for i in range(1, 4)], ignore_index=True)
# 合并 data1 和 data2 为一个总数据
data = pd.concat([data, pd.concat([data1, data2], axis=1)], ignore_index=True)
# 定义一个字典存放数据
dictext = {}
# 遍历 data
for i in range(len(data)):
# 读取“接收人工号”列单元格数据作为字典的 key 值
key = data.iloc[i, 0]
# 读取“推送内容”列的合并列数据作为字典的 value 值
value = ''
for j in range(1, 4):
if pd.notnull(data.iloc[i, j]):
value += str(data.iloc[i, j])
# 将 value 值存入字典,如果 key 已存在,则拼接 value 值
if key in dictext:
dictext[key] += value
else:
dictext[key] = value
```
这段代码可以实现以下功能:
1. 使用 pandas 库的 `read_excel` 函数读取 Excel 文件中的所有表格。
2. 使用 `MultiIndex` 类型读取合并单元格表头。
3. 遍历循环读取所有表格的数据,并将读取到的数据合并为一个总数据。
4. 遍历循环总数据,将“接收人工号”列单元格数据作为字典的 key 值,将“推送内容”列的合并列数据作为字典的 value 值进行字符串拼接,并存入字典中。
pandas读取excel表格中所有的sheets
你可以使用pandas库中的read_excel函数来读取Excel文件中的所有工作表。示例代码如下:
```python
import pandas as pd
# 读取Excel文件中所有工作表
xlsx = pd.read_excel('文件路径.xlsx', sheet_name=None)
# 遍历所有工作表
for sheet_name, sheet_data in xlsx.items():
print(sheet_name)
print(sheet_data.head()) # 打印工作表的前5行数据
```
在上述代码中,sheet_name参数传递了None,表示读取所有工作表。read_excel函数将返回一个字典对象,其中键为工作表的名称,值为DataFrame对象,表示工作表中的数据。你可以遍历字典对象来访问每个工作表的数据。
阅读全文