pandas根据58同城房源销售数据,统计房屋面积(housearea)分别为0-50,51-70,71-90,以及超过90的房源数量
时间: 2024-10-16 16:04:16 浏览: 23
为了使用pandas对58同城房源销售数据进行这种分类统计,你需要首先加载数据到一个DataFrame中,假设数据集名为df,包含housearea列。以下是步骤:
1. **加载数据**:
使用`pandas.read_csv()`或其他适合的数据读取函数,将数据从CSV文件导入到DataFrame。
```python
import pandas as pd
data = pd.read_csv('58同城房源数据.csv')
```
2. **数据清洗**:
确保housearea列没有缺失值,并将其转换为整数类型,以便后续处理。
```python
if 'housearea' in data.columns:
data['housearea'] = pd.to_numeric(data['housearea'], errors='coerce')
data = data.dropna(subset=['housearea'])
```
3. **分段统计**:
将housearea列按照给定的区间范围创建新的类别,并计算每个区间的房源数量。
```python
bin_edges = [0, 50, 70, 90, float('inf')] # 定义分段边界
data['housearea_range'] = pd.cut(data['housearea'], bin_edges, right=False) # 分箱
counts = data['housearea_range'].value_counts() # 统计各区间房源数量
```
4. **结果展示**:
最终,你可以打印出这些统计数据。
```python
print(counts)
```
阅读全文
相关推荐












