import pandas as pd import numpy as np import tkinter as tk def dataframe(): filename=r'500强企业数据.csv' df=pd.read_csv(filename,encoding='ansi') data = list(df['估值(亿元)']) for i, val in enumerate(data): if '~' in val: start, end = val.split('~') avg = int((float(start) + float(end)) / 2) data = str(avg) df['估值(亿元)']=df['估值(亿元)'].replace('data','str(avg)') df1=df.dropna() first=df1['序号'] second=df1['企业名称'] third=df1['估值(亿元)'] forth=df1['所属国家'] fifth=df1['赛道'] newIndex=pd.concat([first,second,third,forth,fifth],axis=1) newIndex.columns=['序号','企业名称','估值(亿元)','所属国家','赛道'] newIndex.to_csv('处理后500强企业数据.csv',encoding='ansi',index=False) tk.messagebox.showinfo('保存文件','文件:处理后500强企业数据.csv保存成功!')
时间: 2024-01-14 16:05:17 浏览: 129
pandas Dataframe行列读取的实例
5星 · 资源好评率100%
这段代码使用 pandas 和 tkinter 库读取并处理了一个名为 "500强企业数据.csv" 的数据文件,然后将处理后的结果保存到一个名为 "处理后500强企业数据.csv" 的新文件中。这个数据文件包含了一些企业的信息,包括序号、企业名称、估值、所属国家和赛道等。在处理过程中,代码首先将估值中的 "~" 符号分隔的数值转换成相应的平均值,然后删除了任何包含缺失数据的行,最后将处理后的结果保存到新文件中。保存成功后,程序会弹出一个提示窗口告诉你保存成功了。
阅读全文