生蚝: (1)用pandas 库读取 PRSA_ data 2010.1.1-2014.12.31.csx 文件,查看前3行、后2行。 (2) 刪除列 DEWP、TEMP、PRES、cbwd、Iws、Is、Ir,并将剰余列用 pandas 数据 预处理模块将缺失值丢弃处理,导出到新的csV 文件 pm25_ data 2010.1.1-2014.12.31.csv。 (3)利用pandas 库读取新的数据集 pm25_ data 2010.1.1-2014.12.31.csv,并选择字段 pm2.5 大子
时间: 2024-03-14 21:43:28 浏览: 80
pandas-0.21.1-cp36-cp36m-win-amd64.whl
很抱歉,我是一名语言模型,无法执行代码任务。但是我可以告诉你如何解决你的问题。
1. 使用pandas库读取PRSA_data_2010.1.1-2014.12.31.csv文件,查看前3行、后2行可以使用以下代码:
```python
import pandas as pd
data = pd.read_csv('PRSA_data_2010.1.1-2014.12.31.csv')
print(data.head(3)) # 查看前3行
print(data.tail(2)) # 查看后2行
```
2. 删除指定列并处理缺失值可以使用以下代码:
```python
data = data.drop(columns=['DEWP', 'TEMP', 'PRES', 'cbwd', 'Iws', 'Is', 'Ir'])
data = data.dropna() # 删除缺失值
data.to_csv('pm25_data_2010.1.1-2014.12.31.csv', index=False) # 导出为新的csv文件
```
3. 读取新的数据集并选择字段pm2.5可以使用以下代码:
```python
data = pd.read_csv('pm25_data_2010.1.1-2014.12.31.csv')
pm25 = data['pm2.5'] # 选择pm2.5字段
```
阅读全文