对"户型"列数据统计,筛选出数量大于50的户型,按数量降序,输出户型数量排名的结果为zfsj3_after.csv文件
时间: 2024-01-21 18:18:44 浏览: 210
文件中的数据排序
5星 · 资源好评率100%
以下是Python代码实现:
```python
import pandas as pd
# 读取原始数据文件
df = pd.read_csv('zfsj3.csv')
# 按户型分组并计数
grouped = df.groupby('户型').size().reset_index(name='数量')
# 筛选数量大于50的户型
filtered = grouped[grouped['数量'] > 50]
# 按数量降序排序
result = filtered.sort_values(by='数量', ascending=False)
# 输出结果到文件
result.to_csv('zfsj3_after.csv', index=False)
```
解释:
1. 首先使用 Pandas 库读取原始数据文件 `zfsj3.csv`。
2. 然后使用 `groupby` 方法按照户型进行分组,并使用 `size` 方法计算每个户型的数量。
3. 将分组后的结果保存为一个新的 DataFrame 对象,并将计数结果命名为“数量”。
4. 使用布尔索引筛选出数量大于50的户型。
5. 使用 `sort_values` 方法按照数量降序排序。
6. 最后使用 `to_csv` 方法将结果保存到文件 `zfsj3_after.csv` 中,注意要设置 `index=False`,否则会将行索引也保存到文件中。
阅读全文