pd.read_csv设置编码格式
时间: 2023-10-29 11:53:47 浏览: 156
快速解决pandas.read_csv()乱码的问题
5星 · 资源好评率100%
在使用pd.read_csv函数读取CSV文件时,可以通过设置encoding参数来设置编码格式。常用的编码格式包括UTF-8、GBK、ISO-8859-1和CP1252等。例如,可以使用以下代码来设置编码格式为GBK:
data = pd.read_csv('./text.csv', encoding="gbk", header=0, index_col=0)
如果出现编码错误UnicodeDecodeError,可以尝试以下解决方法:
1. 设置编码为'UTF-8'或'GBK',例如:pd.read_csv('data.csv', encoding='UTF-8')
2. 将CSV文件用记事本打开并另存为UTF-8编码格式,然后重新读取文件设置编码为'UTF-8',例如:pd.read_csv('data.csv', encoding='UTF-8')
另外,如果不需要第0行的信息,可以通过设置skiprows参数来跳过指定行数的数据。例如:
train_data = pd.read_csv('./data/train.csv', sep=',', encoding='gbk', skiprows=)
以上是关于pd.read_csv设置编码格式的一些方法和示例,你可以根据你的具体需求选择合适的编码格式来读取CSV文件。
阅读全文