Python读取一个文件夹里所有的CSV文件并去除所有CSV文件中的中文
时间: 2024-10-14 20:17:27 浏览: 38
merge_csv:将文件夹中的所有 CSV 文件合并为一个的 python 脚本
在Python中,你可以使用`os`模块来遍历文件夹,`glob`模块来查找匹配特定模式(这里是`.csv`文件),以及`pandas`库来读取和处理CSV文件。为了去除CSV文件中的中文字符,你需要先将整个文件读入`pandas` DataFrame,然后使用`replace`函数替换中文字符为空值或者你想要的其他字符。下面是一个示例:
```python
import os
import glob
import pandas as pd
def remove_chinese_chars(file_path):
# 读取CSV文件
data = pd.read_csv(file_path)
# 使用正则表达式移除中文字符,这里假设是全角中文
cleaned_data = data.applymap(lambda x: str(x).translate({ord(c): None for c in '\u4e00-\u9fa5'}))
# 保存处理后的文件,例如替换空值或转为英文逗号分隔
cleaned_data.to_csv(os.path.join(os.path.dirname(file_path), 'cleaned_' + os.path.basename(file_path)), sep=';', na_rep='', encoding='utf-8-sig')
# 指定要处理的文件夹路径
folder_path = '/path/to/your/folder'
# 遍历文件夹内的所有CSV文件
for file in glob.glob(os.path.join(folder_path, '*.csv')):
remove_chinese_chars(file)
```
这个脚本会遍历指定文件夹内的所有`.csv`文件,逐个处理,并将结果保存为原文件名前加上`cleaned_`的新版本。
阅读全文