我用gb2313编码了我从html中得到的文本,现在存在了df表里,我现在想把他另存为csv,同时要避免乱码问题,请给出代码
时间: 2023-04-05 09:02:32 浏览: 106
批量修改csv文件编码错乱问题
可以使用Python的csv模块来实现将gb2312编码的文本另存为csv文件,并避免乱码问题。代码如下:
```python
import csv
with open('df.csv', 'w', newline='', encoding='utf-8-sig') as csvfile:
writer = csv.writer(csvfile)
for row in df.values:
writer.writerow([cell.encode('gb2312').decode('gb2312') for cell in row])
```
其中,`df`是包含文本的DataFrame,`gb2312`是文本的编码格式,`utf-8-sig`是csv文件的编码格式,`newline=''`是为了避免在Windows系统下出现空行的问题。
阅读全文