pandas读取csv文件并将gbk字符串转换为utf-8
时间: 2023-09-13 08:10:32 浏览: 318
c gbk和 utf-8 转换
5星 · 资源好评率100%
可以使用 pandas 库中的 `read_csv()` 方法来读取 csv 文件,并通过 `encoding` 参数指定文件的编码格式为 gbk。然后可以使用 `to_csv()` 方法将读取的数据再次写入 csv 文件,并通过 `encoding` 参数指定文件的编码格式为 utf-8。
以下是一个示例代码:
```python
import pandas as pd
# 读取 csv 文件,指定编码格式为 gbk
df = pd.read_csv("file.csv", encoding="gbk")
# 将数据转换为 utf-8 编码并写入 csv 文件
df.to_csv("file_utf8.csv", index=False, encoding="utf-8")
```
上述代码中,`read_csv()` 方法读取了名为 `file.csv` 的 csv 文件,并指定编码格式为 gbk。然后,将读取的数据存储在名为 `df` 的 pandas DataFrame 对象中。
接着,使用 `to_csv()` 方法将 DataFrame 对象中的数据写入名为 `file_utf8.csv` 的 csv 文件,并指定编码格式为 utf-8。`index=False` 参数用于去除 DataFrame 对象中的行索引。
阅读全文