(1)用pandas 库读取 PRSA_ data 2010.1.1-2014.12.31.csx 文件,查看前3行、后2行。 (2) 刪除列 DEWP、TEMP、PRES、cbwd、Iws、Is、Ir,并将剰余列用 pandas 数据 预处理模块将缺失值丢弃处理,导出到新的csV 文件 pm25_ data 2010.1.1-2014.12.31.csv。 (3)利用pandas 库读取新的数据集 pm25_ data 2010.1.1-2014.12.31.csv,并选择字段 pm2.5 大子300
时间: 2024-03-14 12:43:19 浏览: 117
好的,我明白了。以下是回答:
(1) 用pandas库读取PRSA_data_2010.1.1-2014.12.31.csv文件,查看前3行、后2行。
```python
import pandas as pd
# 读取csv文件
data = pd.read_csv('PRSA_data_2010.1.1-2014.12.31.csv')
# 查看前3行
print(data.head(3))
# 查看后2行
print(data.tail(2))
```
(2) 删除列DEWP、TEMP、PRES、cbwd、Iws、Is、Ir,并将剩余列用pandas数据预处理模块将缺失值丢弃处理,导出到新的CSV文件pm25_data_2010.1.1-2014.12.31.csv。
```python
# 删除列
data = data.drop(['DEWP', 'TEMP', 'PRES', 'cbwd', 'Iws', 'Is', 'Ir'], axis=1)
# 处理缺失值
data = data.dropna()
# 导出为新的CSV文件
data.to_csv('pm25_data_2010.1.1-2014.12.31.csv', index=False)
```
(3) 利用pandas库读取新的数据集pm25_data_2010.1.1-2014.12.31.csv,并选择字段pm2.5大于300。
```python
# 读取新的CSV文件
data = pd.read_csv('pm25_data_2010.1.1-2014.12.31.csv')
# 选择pm2.5大于300的数据
data = data[data['pm2.5'] > 300]
```
阅读全文