利用Python读取CSV文件并对数据中非utf-8符号进行切片和替换
时间: 2024-02-13 21:04:04 浏览: 131
python读取当前目录下的CSV文件数据
5星 · 资源好评率100%
好的,以下是利用Python读取CSV文件并对数据中非utf-8符号进行切片和替换的方法:
1. 导入csv库和re库(正则表达式库)
```python
import csv
import re
```
2. 创建一个正则表达式,用于匹配非utf-8符号
```python
pattern = re.compile(r'[^\x00-\x7F]+') # 匹配非utf-8符号
```
3. 打开CSV文件并读取数据,对数据进行切片并替换非utf-8符号
```python
with open('example.csv', 'r') as file:
csv_reader = csv.reader(file)
data = list(csv_reader)
sliced_data = [[re.sub(pattern, '', cell) for cell in row] for row in data]
```
这样就可以利用Python读取CSV文件并对数据中非utf-8符号进行切片和替换了。sliced_data是一个二维数组,其中每个元素是对应单元格中的替换后的字符串。
阅读全文