帮我优化一下这些代码:import pandas as pd import datetime df_201=pd.read_excel(r'C:\Users\82422\Desktop\问E讲堂excel\5.04问医晚上数据.xlsx',sheet_name='邀请用户信息') df_201=df_201.drop(['编号','用户ID'],axis=1) #df_201=df_201.rename(columns={'累计观看时长': '2023.5.04累计观看时长'}) #df_201=df_201.rename(columns={'累计观看时长': str(datetime.date.today())+'累计观看时长'}) #将累计观看时长更改成当前日期的累计观看时长 print(df_201.head())import pandas as pd import os df1=pd.DataFrame() for root,dirs,files in os.walk(r'C:\Users\82422\Desktop\问E讲堂excel'): print('root:\n',root) print('dirs:\n',dirs) print('files:\n',files) for file in files: file_name=os.path.join(root,file) df=pd.read_excel(file_name,sheet_name='邀请用户信息') df=df.drop(['编号','用户ID'],axis=1) df=df.rename(columns={'累计观看时长': file[0:4] +'累计观看时长'}) df_201=pd.merge(df,df_201,on=['邀请人昵称','用户昵称'],how='outer') print(df_201) df_201.to_excel(r'C:\Users\82422\Desktop\问E讲堂excel\h2.xlsx',sheet_name='邀请用户信息')
时间: 2023-06-13 11:08:13 浏览: 159
详解pandas库pd.read_excel操作读取excel文件参数整理与实例
import pandas as pd
import os
# 读取单个文件的函数,避免重复代码
def read_file(file_path):
df = pd.read_excel(file_path, sheet_name='邀请用户信息')
df = df.drop(['编号', '用户ID'], axis=1)
date_str = os.path.basename(file_path)[0:4] + '.5.04'
df = df.rename(columns={'累计观看时长': date_str+'累计观看时长'})
return df
# 读取第一个文件
df_201 = pd.read_excel(r'C:\Users\82422\Desktop\问E讲堂excel\5.04问医晚上数据.xlsx', sheet_name='邀请用户信息')
df_201 = df_201.drop(['编号', '用户ID'], axis=1)
date_str = datetime.date.today().strftime('%Y.%m.%d')
df_201 = df_201.rename(columns={'累计观看时长': date_str+'累计观看时长'})
# 遍历文件夹,读取并合并所有文件
for root, dirs, files in os.walk(r'C:\Users\82422\Desktop\问E讲堂excel'):
for file in files:
file_path = os.path.join(root, file)
if file.endswith('.xlsx') and file != '5.04问医晚上数据.xlsx': # 排除第一个文件
df = read_file(file_path)
df_201 = pd.merge(df, df_201, on=['邀请人昵称', '用户昵称'], how='outer')
# 保存合并后的结果
df_201.to_excel(r'C:\Users\82422\Desktop\问E讲堂excel\h2.xlsx', sheet_name='邀请用户信息', index=False)
阅读全文