pandas读取stata文件
时间: 2023-09-14 20:05:03 浏览: 286
使用 Pandas 读取 Stata 文件非常简单,只需要使用 `pandas.read_stata()` 函数即可。该函数的语法如下:
```python
import pandas as pd
pd.read_stata(filepath_or_buffer, convert_categoricals=True, convert_missing=False, preserve_dtypes=True, columns=None)
```
其中,参数 `filepath_or_buffer` 是 Stata 文件的路径或文件对象。其他参数的含义如下:
- `convert_categoricals`: 是否将分类变量转换为 `pandas` 中的 `Categorical` 类型,默认为 `True`。
- `convert_missing`: 是否将 Stata 中的缺失值转换为 `NaN`,默认为 `False`。
- `preserve_dtypes`: 是否保留 Stata 文件中的数据类型,例如 `byte`、`int`、`long`、`float`、`double` 等,默认为 `True`。
- `columns`: 如果不想读取所有的列,可以指定要读取的列名列表。
下面是一个例子:
```python
import pandas as pd
data = pd.read_stata('data_file.dta')
print(data.head())
```
该代码读取名为 `data_file.dta` 的 Stata 文件,并将其存储在名为 `data` 的 Pandas 数据框中。最后,使用 `head()` 函数查看前五行数据。
阅读全文