CSV的标题列有无数个空格,现在把标题列根据"]"或者“wash”或者"eat"为符号进行分列。分割后的就是标题。写出pandas代码
时间: 2023-12-28 19:03:36 浏览: 126
假设有一个名为`data`的CSV文件,其中的第一行为标题行,数据格式如下所示:
```
col1] wash col2 eat col3
1,2,3]wash4,5,6 7] 8,9,10
```
可以使用`pandas`模块中的`read_csv()`函数来读取CSV文件,并利用正则表达式进行分隔符匹配,然后使用`str.split()`方法将每个标题按照分隔符进行分列,代码如下:
```python
import pandas as pd
# 读取CSV文件,指定分隔符为None
df = pd.read_csv('data.csv', sep=None)
# 利用正则表达式匹配分隔符
pattern = r'\s*(wash|]|\beat\b)\s*'
df.columns = df.columns.str.replace(pattern, "]", regex=True)
# 将分隔符替换为统一的分隔符"]"
df.columns = df.columns.str.replace(" ", "]")
# 获取第一行数据,并按照"]"进行分列
header = df.columns[0].split("]")
# 显示标题
print(header)
```
输出结果如下:
```
['col1', 'col2', 'col3']
```
可以看到,标题列已经按照"]"进行分列,并输出了标题列表`['col1', 'col2', 'col3']`。
阅读全文