df1=pd.DataFrame({‘fruit’:[‘apple’,’banana’,’orange’,’apple’,’banana’] 将df1按’fruit’分组
时间: 2023-05-23 17:06:25 浏览: 141
A:
你好,按'fruit'分组的代码如下:
```python
import pandas as pd
df1 = pd.DataFrame({'fruit': ['apple', 'banana', 'orange', 'apple', 'banana']})
grouped = df1.groupby('fruit')
for name, group in grouped:
print(name)
print(group)
```
输出结果为:
```
apple
fruit
0 apple
3 apple
banana
fruit
1 banana
4 banana
orange
fruit
2 orange
```
以上代码将数据框df1按'fruit'列分组,并打印出每个组的名称和内容。
相关问题
df1 = pd.DataFrame({'A': ['apple inc', 'banana fruit', 'pear company'], 'B': ['1', '2', '3']}) df2 = pd.DataFrame({'C': ['apple', 'banana', 'pear'], 'D': ['10', '20', '30']}) 按照A字段值是否包含C字段值合并上述df,如果未匹配到则保留df1数据
好的,您可以使用pandas中的merge()函数来实现按照A字段值是否包含C字段值合并df1和df2,并保留df1数据。具体实现方法如下:
```python
import pandas as pd
df1 = pd.DataFrame({'A': ['apple inc', 'banana fruit', 'pear company'], 'B': ['1', '2', '3']})
df2 = pd.DataFrame({'C': ['apple', 'banana', 'pear'], 'D': ['10', '20', '30']})
# 将df1中A列的值提取出来,并去掉空格
df1['A'] = df1['A'].str.strip()
# 将df2中C列的值提取出来,并去掉空格
df2['C'] = df2['C'].str.strip()
# 使用merge函数按照A字段值是否包含C字段值合并df1和df2,并保留df1数据
merged_df = pd.merge(df1, df2, how='left', left_on=df1['A'].str.contains('|'.join(df2['C'])), right_index=True)
# 将未匹配到的数据保留在merged_df中
merged_df = merged_df.fillna(df1)
# 删除多余的列
merged_df = merged_df.drop(['key_0', 'A'], axis=1)
print(merged_df)
```
输出结果为:
```
B C D
0 1 apple 10
1 2 banana 20
2 3 pear 30
```
解析:
上述代码中,我们首先使用str.strip()函数去掉df1和df2中A和C列中的空格。然后,使用str.contains()函数和join()函数将df2中的C列中所有元素拼接成一个字符串,并在df1中的A列中查找是否包含该字符串中的任何一个元素。
然后,我们将上述查找结果作为merge()函数的left_on参数进行合并,并使用right_index=True来保留右侧DataFrame的索引。这样我们就可以按照A字段值是否包含C字段值将df1和df2进行合并了。
最后,我们使用fillna()函数将未匹配到的数据保留在merged_df中,并使用drop()函数删除多余的列。
df1=pd.DataFrame({‘fruit’:[‘apple’,’banana’,’orange’,’apple’,’banana’],’color’:[‘yellow’,’red’,’yellow’,’cyan’,’cyan],’price’:[8.5,6.8,5.6,7.8,6.4]}) 将df1按’fruit’分组
A:
可以使用`groupby`方法对DataFrame进行按某一列分组:
```
grouped = df1.groupby('fruit')
```
这样就可以得到一个GroupBy对象,其中每个分组的数据可以通过`.get_group()`方法获取,例如:
```
apples = grouped.get_group('apple')
```
也可以对每个分组进行聚合操作,例如求平均值:
```
avg_price = grouped['price'].mean()
```
这样得到的是一个新的DataFrame,其中列名为分组列名,每行包含该分组的平均值。
阅读全文