python 使用pandas库,使用 pandas 库中的 read_excel 函数和 MultiIndex 类型来读取合并单元格表头,操作excel文件“data\推送名单.xlsx”,遍历循环读取所有sheet表,读取表头“接收人工号”的所在列数据data1和读取合并单元格表头“推送内容”的所在的合并列的所有数据data2(示列:B列,C列,D列的第一行是合并单元格,是‘推送内容’表头),合并data1,data2为一个总数据data,表头还是之前读取的数据表头“接收人工号”,和合并表头“推送内容”,定义一个字典dictext,定义一个字符串strtext,对data做遍历循环,表头“接收人工号”的列单元格数据为字典的key值,表头为“推送内容”的合并列数据做字符串拼接strtext(表头为“推送内容”的合并列的单元格数据有转行,有特殊符号),strtext做字典的value值,每行遍历都重置strtext 相关所有代码
时间: 2024-03-09 13:49:10 浏览: 64
pandas read_excel()和to_excel()函数解析
以下是您所需的代码:
```python
import pandas as pd
# 读取 Excel 文件中的所有表格
xls = pd.ExcelFile('data/推送名单.xlsx')
# 定义一个空 DataFrame 存放所有表格数据
data = pd.DataFrame()
# 遍历所有表格
for sheet_name in xls.sheet_names:
# 读取表格数据,跳过前两行
df = pd.read_excel(xls, sheet_name, header=2)
# 读取表头为“接收人工号”的列单元格数据
data1 = df['接收人工号']
# 读取表头为“推送内容”的合并列的所有数据,合并为一个 Series
data2 = pd.concat([df.iloc[:, i] for i in range(1, 4)], ignore_index=True)
# 合并 data1 和 data2 为一个总数据
data = pd.concat([data, pd.concat([data1, data2], axis=1)], ignore_index=True)
# 重置表头,包括“接收人工号”列和“推送内容”列合并后的表头
data.columns = ['接收人工号', '推送内容']
# 定义一个字典存放数据
dictext = {}
# 遍历 data
for i in range(len(data)):
# 读取“接收人工号”列单元格数据作为字典的 key 值
key = data.iloc[i, 0]
# 读取“推送内容”列的合并列数据作为字典的 value 值
value = ''
for j in range(1, 4):
if pd.notnull(data.iloc[i, j]):
value += str(data.iloc[i, j])
# 将 value 值存入字典,如果 key 已存在,则拼接 value 值
if key in dictext:
dictext[key] += value
else:
dictext[key] = value
```
这段代码与之前的代码的区别在于:
1. 在读取完所有表格的数据后,重置了表头,将“接收人工号”列和“推送内容”列合并后的表头作为新的表头。
2. 在遍历 data 时,读取“接收人工号”列单元格数据作为字典的 key 值,读取“推送内容”列的合并列数据作为字典的 value 值,并进行字符串拼接。
阅读全文