pd.read_csv 中na_values设置的代码
时间: 2023-11-19 14:56:23 浏览: 212
pandas中read_csv的缺失值处理方式
pd.read_csv() 中的 na_values 参数用于指定哪些值应该被视为缺失值。在读取 CSV 文件时,如果文件中包含指定的值,则 Pandas 会将其视为缺失值。该参数可以接受一个列表、一个字符串或一个字典作为输入。例如,如果我们想将 CSV 文件中的 "N/A" 和 "NULL" 视为缺失值,可以这样设置 na_values 参数:
```python
import pandas as pd
df = pd.read_csv('data.csv', na_values=['N/A', 'NULL'])
```
这样,当 Pandas 读取 CSV 文件时,它会将 "N/A" 和 "NULL" 视为缺失值,并将其转换为 NaN。如果我们想将不同的值视为缺失值,可以使用字典来指定:
```python
import pandas as pd
df = pd.read_csv('data.csv', na_values={'A': [-1, 'N/A'], 'B': ['missing', 'NA']})
```
这样,Pandas 会将列 A 中的 -1 和 "N/A",以及列 B 中的 "missing" 和 "NA" 视为缺失值,并将其转换为 NaN。
阅读全文