如何在python读取csv文件并创建自定义数据集,且不会出现utf-8的编码报错
时间: 2023-03-20 21:01:45 浏览: 91
gbk转Utf8_编码转换_firegbi_GBK转UTF-8_
在Python中读取CSV文件并创建自定义数据集,可以使用pandas库中的read_csv()函数。为了避免出现UTF-8编码报错,可以在read_csv()函数中指定参数encoding为"utf-8"。
以下是一个简单的示例代码,演示了如何使用read_csv()函数读取CSV文件并创建自定义数据集:
```python
import pandas as pd
# 读取CSV文件并创建数据集
data = pd.read_csv('example.csv', encoding='utf-8')
# 打印数据集的前5行
print(data.head())
```
在上面的示例代码中,我们首先使用pandas库中的read_csv()函数读取名为"example.csv"的CSV文件,并指定编码为UTF-8。然后,我们将读取到的数据存储在一个名为"data"的变量中,并使用head()函数打印数据集的前5行。
需要注意的是,在读取CSV文件时,应该确保文件路径正确,并且CSV文件应该包含正确的列名和数据格式。
阅读全文