dataframe 一列数据自定义范围统计
时间: 2023-07-06 08:06:20 浏览: 142
基于Python数据分析之pandas统计分析
可以使用 Pandas 库中的条件筛选方法来实现一列数据自定义范围统计。例如,假设有一个 DataFrame df,其中有一列数据为 column,需要统计在 [0, 50) 范围内的数据个数和总和,可以按照以下步骤操作:
1. 使用条件筛选方法选择在指定范围内的数据:
```
subset = df[(df['column'] >= 0) & (df['column'] < 50)]
```
2. 使用 count 和 sum 方法分别统计符合条件的数据个数和总和:
```
count = subset['column'].count()
sum = subset['column'].sum()
```
3. 输出结果:
```
print('Count:', count)
print('Sum:', sum)
```
完整代码示例:
```
import pandas as pd
# 创建示例 DataFrame
data = {'column': [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]}
df = pd.DataFrame(data)
# 统计 [0, 50) 范围内的数据个数和总和
subset = df[(df['column'] >= 0) & (df['column'] < 50)]
count = subset['column'].count()
sum = subset['column'].sum()
# 输出结果
print('Count:', count)
print('Sum:', sum)
```
输出结果:
```
Count: 4
Sum: 100
```
阅读全文