没有合适的资源?快使用搜索试试~ 我知道了~
首页python merge、concat合并数据集的实例讲解
资源详情
资源评论
资源推荐

python merge、、concat合并数据集的实例讲解合并数据集的实例讲解
下面小编就为大家分享一篇python merge、concat合并数据集的实例讲解,具有很好的参考价值,希望对大家
有所帮助。一起跟随小编过来看看吧
数据规整化:合并、清理、过滤数据规整化:合并、清理、过滤
pandas和python标准库提供了一整套高级、灵活的、高效的核心函数和算法将数据规整化为你想要的形式!
本篇博客主要介绍:
合并数据集:.merge()、.concat()等方法,类似于SQL或其他关系型数据库的连接操作。
合并数据集合并数据集
1)) merge 函数参数函数参数
参数参数 说明说明
left 参与合并的左侧DataFrame
right 参与合并的右侧DataFrame
how 连接方式:‘inner'(默认);还有,‘outer'、‘left'、‘right'
on
用于连接的列名,必须同时存在于左右两个DataFrame对象中,如果位指定,则以left和right列名的交集作为连接
键
left_on 左侧DataFarme中用作连接键的列
right_on 右侧DataFarme中用作连接键的列
left_index 将左侧的行索引用作其连接键
right_index 将右侧的行索引用作其连接键
sort 根据连接键对合并后的数据进行排序,默认为True。有时在处理大数据集时,禁用该选项可获得更好的性能
suffixes
字符串值元组,用于追加到重叠列名的末尾,默认为(‘_x',‘_y').例如,左右两个DataFrame对象都有‘data',则
结果中就会出现‘data_x',‘data_y'
copy 设置为False,可以在某些特殊情况下避免将数据复制到结果数据结构中。默认总是赋值
1、多对一的合并(一个表的连接键列有重复值,另一个表中的连接键没有重复值)、多对一的合并(一个表的连接键列有重复值,另一个表中的连接键没有重复值)
import pandas as pd
import numpy as np
df1 = pd.DataFrame({'key':['b','b','a','c','a','a','b'],'data1': range(7)})
df1
data1 key
0 0 b
1 1 b
2 2 a
3 3 c
4 4 a
5 5 a
6 6 b
df2 = pd.DataFrame({'key':['a','b','d'],'data2':range(3)})
df2
data2 key
0 0 a
1 1 b
2 2 d
pd.merge(df1,df2)#默认情况
data1 key data2
0 0 b 1


















安全验证
文档复制为VIP权益,开通VIP直接复制

评论0