python实现按指定列指定字符串匹配拆分csv文件,并输出符合条件的所有数据
时间: 2023-12-27 21:03:07 浏览: 93
python实现对csv文件的读取和对第5列的排序
要实现按指定列指定字符串匹配拆分csv文件,并输出符合条件的所有数据,可以使用pandas库来实现。以下是一个示例代码:
```python
import pandas as pd
# 读取csv文件
df = pd.read_csv('example.csv')
# 按指定列拆分并匹配字符串
for col in ['col1', 'col3']:
# 获取指定列的数据
col_data = df[col]
# 匹配字符串并获取符合条件的行
condition = col_data.str.contains('match_string')
matched_data = df[condition]
# 输出符合条件的数据并创建新的csv文件
if not matched_data.empty:
print(matched_data)
matched_data.to_csv(f'{col}_matched.csv', index=False)
```
这段代码将会把名为`example.csv`的文件按照指定的列`col1`和`col3`拆分成两个文件,然后在每个文件中匹配字符串`match_string`,并输出符合条件的所有数据。同时,还会在文件夹中创建新的csv文件,文件名为`col1_matched.csv`和`col3_matched.csv`,文件中仅包含符合条件的数据,不包含列头。如果需要包含列头,只需在每个拆分的文件中添加`header=[col]`参数即可。
阅读全文