pandas的split
时间: 2023-07-09 13:21:02 浏览: 118
pandas分组聚合
pandas的split()函数可以用于将一个字符串列按照指定的分隔符拆分成多个新列。它的语法如下:
```python
new_df = df['column_name'].str.split(pat=None, n=-1, expand=False)
```
其中,参数pat指定分隔符,如果不指定则默认使用空格;参数n指定拆分成的最大列数,如果不指定则拆分成尽可能多的列;参数expand指定是否将拆分后的列展开成新的DataFrame,如果为True则展开,否则返回一个Series对象。
例如,假设有如下DataFrame:
```python
import pandas as pd
df = pd.DataFrame({'name': ['Alice,Bob', 'Charlie', 'Dave,Eve'], 'age': [25, 30, 35]})
```
我们可以使用split()函数将name列按照逗号分隔符拆分成两个新列,代码如下:
```python
new_df = df['name'].str.split(pat=',', n=1, expand=True)
```
结果为:
```
0 1
0 Alice Bob
1 NaN NaN
2 Dave Eve
```
可以看到,拆分后的结果生成了两个新列,分别为0和1,可以使用列名来访问这些新列。需要注意的是,如果某个单元格的值中不包含分隔符,则对应的新列中会填充NaN值。
阅读全文