pd.read_csv读取utf-8
时间: 2023-07-06 19:41:28 浏览: 18
`pd.read_csv`函数默认就会将文件按照UTF-8编码读取。如果你的CSV文件是用UTF-8编码保存的,直接使用`pd.read_csv`即可。
```python
import pandas as pd
df = pd.read_csv('filename.csv')
```
其中,'filename.csv'是你要读取的CSV文件名。
如果你使用`pd.read_csv`读取文件时出现了UnicodeDecodeError错误,可能是因为文件的编码格式不是UTF-8。这时你可以指定正确的编码格式进行读取,例如:
```python
import pandas as pd
df = pd.read_csv('filename.csv', encoding='正确的编码格式')
```
其中,'正确的编码格式'可以根据实际情况进行指定,例如GBK、GB2312等。
除了指定编码格式外,你还可以通过设置sep参数来指定CSV文件中的列分隔符,例如:
```python
import pandas as pd
df = pd.read_csv('filename.csv', sep=';')
```
其中,';'是CSV文件中的列分隔符。如果你的CSV文件中使用的是其他分隔符,可以根据实际情况进行指定。