df=pd.merge(df_1,df_2)是什么意思

这段代码是将两个数据框通过某个共同的列进行合并（类似于SQL中的join操作）。其中，df_1和df_2分别表示两个要合并的数据框，pd代表引入的pandas库，merge()是pandas库中用于合并数据框的函数，最终合并后的数据框赋值给了df变量。

解释下这段代码第三方商品 df1 = temp_df[__temp_df['show_name'] == '第三方商品'] if not df1.empty: df1 = __df1.pivot_table(index=['name', 'show_name'], values=['buy_num'], aggfunc=np.sum).reset_index() else: df1 = df1[['name', 'show_name', 'buy_num']] # 非第三方商品 df2 = temp_df[__temp_df['show_name'] != '第三方商品'] if not df2.empty: df2 = __df2.pivot_table(index=['gt_uuid', 'show_name'] ,values=['buy_num'], aggfunc=np.sum).reset_index() df2 = pd.merge(left=df2, right=pd.DataFrame(s_gt_rv, columns=['gt_uuid', 'goods_name']), how='left', on='gt_uuid') df2 = df2[['goods_name', 'show_name', 'buy_num']] __df2.rename(columns={'goods_name': 'name'}, inplace=True) else: df2 = df2[['name', 'show_name', 'buy_num']] __temp_df = pd.concat([df1, df2]) del df1, df2 __temp_df.rename(columns={'name': 'goods_name', 'show_name': 'gc_name', 'buy_num': 'num'}, inplace=True) __temp_df.sort_values(by='num', ascending=False, inplace=True) return_data['goods']['goods_list'] = __temp_df.to_dict(orient='records') __temp_df = __temp_df[['gc_name', 'num']] __temp_df = __temp_df.pivot_table(index='gc_name', values='num', aggfunc=np.sum).reset_index() __temp_df.sort_values(by='num', ascending=False, inplace=True) return_data['goods']['gc_list'] = __temp_df.to_dict(orient='records') del __temp_df

这段代码是对一个名为 `__temp_df` 的数据框进行处理，并将处理结果存储在 `return_data` 字典的 `goods` 键下。首先，根据条件 `__temp_df['show_name'] == '第三方商品'`，筛选出满足条件的行，存储在 `__df1` 中。如果 `__df1` 不为空，则对其进行数据透视操作，按照 `name` 和 `show_name` 分组，计算 `buy_num` 的总和，并重置索引。否则，保留 `__df1` 的 `name`、`show_name` 和 `buy_num` 列。接着，根据条件 `__temp_df['show_name'] != '第三方商品'`，筛选出满足条件的行，存储在 `__df2` 中。如果 `__df2` 不为空，则对其进行数据透视操作，按照 `gt_uuid` 和 `show_name` 分组，计算 `buy_num` 的总和，并重置索引。然后，将 `__df2` 与一个包含列名为 `['gt_uuid', 'goods_name']` 的 DataFrame 进行左连接，并将结果存储在 `__df2` 中。最后，保留 `__df2` 的 `goods_name`、`show_name` 和 `buy_num` 列，并将列名 `goods_name` 改为 `name`。接下来，通过合并 `__df1` 和 `__df2` 构成新的数据框 `__temp_df`。之后，删除 `__df1` 和 `__df2` 变量。然后，对 `__temp_df` 进行列名的重命名，将 `name` 改为 `goods_name`，`show_name` 改为 `gc_name`，`buy_num` 改为 `num`。将 `__temp_df` 按照 `num` 降序排序。接着，将 `__temp_df` 转换为字典格式，并将结果存储在 `return_data` 字典的 `goods_list` 键下。再次对 `__temp_df` 进行处理，只保留 `gc_name` 和 `num` 两列，并进行数据透视操作，按照 `gc_name` 分组，计算 `num` 的总和，并重置索引。最后，将结果按照 `num` 降序排序。最后，将处理后的 `__temp_df` 转换为字典格式，并将结果存储在 `return_data` 字典的 `gc_list` 键下。最后，删除 `__temp_df` 变量。

f_list = os.listdir('/home/kesci/input/gaokaodata') df_2 = pd.DataFrame() for f in f_list: temp_df = pd.read_csv(os.path.join('/home/kesci/input/gaokaodata', f), encoding='utf-8') if df_2.empty: df_2 = temp_df else: df_2 = df_2.append(temp_df) df = pd.merge(df_1, df_2, how='inner', left_on=['年份', '录取批次', '招生地址', '考生类别'], right_on=['年份', '批次', '地区', '考生类别'])

这段代码的作用是： 1. 读取指定目录下所有文件夹中的csv文件，将它们合并成一个数据框df_2，其中f_list是指定目录下所有文件夹的列表，os.listdir()函数用于获取指定路径下的所有文件及文件夹的名称。 2. 读取另外一个数据框df_1，该数据框的内容没有在代码中展示。 3. 将df_1和df_2按照指定的列进行合并，并生成一个新的数据框df。其中pd.merge()函数用于按照指定的列将两个数据框进行合并。具体地说，这段代码首先读取指定路径下所有csv文件，将它们合并成一个数据框df_2。然后读取另一个数据框df_1。最后，使用pd.merge()函数将df_1和df_2按照指定的列进行合并，生成一个新的数据框df。这样可以方便地进行数据分析和处理。

阅读全文

df=pd.merge(df_1,df_2)是什么意思

相关推荐

Merge(合并两个已排好序的数组)

join.zip_Python_

python数据分析-献金数据contb-1.csv,contb-2.csv,contb-3.csv

merged_df4 = pd.merge(merged_df3, IV, left_index=True, right_index=True) 什么意思

解释total_df = pd.merge(paper_df,cite_df,on='title_name',how='outer')

data=pd.merge(train_df,store_df,on='store_nbr')

使用total_df = pd.merge(paper_df,cite_df,on='title_name',how='inner')，为什么会多出数据

使用total_df = pd.merge(paper_df,cite_df,on='title_name',how='innerr')，为什么会出现重复行

解释total_df = pd.merge(paper_df,cite_df,on='title_name',how='outer')中的how是什么，以及其他模式包含哪些

mt_df = pd.merge(mt_df, third_df, left_on='门店id', right_on='三方id', how='left')

# result_df = pd.merge(mongo_df, sql_server_df, how='left', left_on='userId', right_on='i_ui_identifier')怎么控制表链接后的查询结果中字段？如何写？

merge_df = pd.merge( base_data, df2, on=["盘口", "公平赔率flag", "正常赔率flag", "赔率", "赛事类型"], how="left") 报错unhashable type: 'list'

# 读取CSV文件 df1 = pd.read_csv('day01.csv') df2 = pd.read_csv('app_class.csv') # 比对两列数据 merged_df = df1.merge(df2, on='appid', how='inner') merged_df['appid'] = merged_df['type'] # 保留相同的数据 merged_df.to_csv('day01.csv', index=False) merged_df KeyError: 'type'

大家在看

NPPExport_0.3.0_32位64位版本.zip

H.323协议详解

单片机与DSP中的基于DSP的PSK信号调制设计与实现

DB2创建索引和数据库联机备份之间有冲突_一次奇特的锁等待问题案例分析-contracted.doc

IQ失衡_IQ失衡；I/Qimbalance；_IQ不均衡_

最新推荐

Windows下操作Linux图形界面的VNC工具

【SketchUp Ruby API：从入门到精通】

VMware虚拟机打开虚拟网络编辑器出现由于找不到vnetlib.dll,无法继续执行代码。重新安装程序可能会解决问题

基于Preact的高性能PWA实现定期天气信息更新

从停机到上线，EMC VNX5100控制器SP更换的实战演练

ubuntu labelme中文版安装

全新免费HTML5商业网站模板发布

EMC VNX5100控制器SP更换全流程指南：新手到高手的必备技能

lamada函数

快速掌握C++ STL：30秒学会核心功能