对pandas数据集指定列数据进行求和筛选,要求保留85~105区间内的数据,输出不符合要求的物品名称,一共有3个数据集需要如此处理,数据集名称如下df1,df2,df3
时间: 2024-03-05 08:53:37 浏览: 64
pandas数据处理基础之筛选指定行或者指定列的数据
5星 · 资源好评率100%
好的,您可以使用以下代码实现:
```python
import pandas as pd
# 读取数据集
df1 = pd.read_csv('df1.csv')
df2 = pd.read_csv('df2.csv')
df3 = pd.read_csv('df3.csv')
# 指定列数据求和
df1_sum = df1['column_name'].sum()
df2_sum = df2['column_name'].sum()
df3_sum = df3['column_name'].sum()
# 筛选保留85~105区间内的数据
df1_filtered = df1[(df1['column_name'] < 85) | (df1['column_name'] > 105)]
df2_filtered = df2[(df2['column_name'] < 85) | (df2['column_name'] > 105)]
df3_filtered = df3[(df3['column_name'] < 85) | (df3['column_name'] > 105)]
# 输出不符合要求的物品名称
df1_filtered_names = df1_filtered['item_name'].tolist()
df2_filtered_names = df2_filtered['item_name'].tolist()
df3_filtered_names = df3_filtered['item_name'].tolist()
print('df1中不符合要求的物品名称:', df1_filtered_names)
print('df2中不符合要求的物品名称:', df2_filtered_names)
print('df3中不符合要求的物品名称:', df3_filtered_names)
```
其中,`column_name`需要替换为您要求和的列名,`item_name`需要替换为您要输出的物品名称列的列名。如果您的数据集中没有列名,可以在读取数据集时设置`header=None`,并在使用列时使用索引号代替列名。
阅读全文