dataframe的列A取值为字符串,现在想将列A取值的括号内的内容剥离出来,生成新的一列B
时间: 2023-04-06 09:00:34 浏览: 58
您好,可以使用正则表达式来实现这个需求。可以使用 pandas 的 str.extract() 方法,例如:
df['B'] = df['A'].str.extract('\((.*?)\)')
这个正则表达式会匹配 A 列中括号内的内容,然后将匹配到的内容提取出来,存储到 B 列中。
相关问题
如果dataframe列A取值为空,那么让生成列B=列A+1;否则就生成列B=列A
你可以使用如下代码来实现:
```python
import pandas as pd
# 创建 dataframe
df = pd.DataFrame({
'A': ['a', '', 'b', 'c', ''],
})
# 生成列B
df['B'] = df['A'].apply(lambda x: x+'1' if x == '' else x)
# 打印 dataframe
print(df)
```
输出结果为:
```
A B
0 a a
1 1
2 b b
3 c c
4 1
```
其中,使用 `apply` 方法将一个函数应用到每个元素上,根据列A是否为空来生成列B的值。
如果dataframe列A取值为NaN,那么让生成列B=列A+1;否则就生成列B=列A
你好!谢谢你的提问。针对你的问题,可以使用 pandas 库来处理。以下是一种实现方式:
```python
import pandas as pd
# 假设原始数据为 df,包含列 A 和列 B
df = pd.DataFrame({'A': [1, 2, float('nan'), 4], 'B': [0, 0, 0, 0]})
# 使用 fillna 方法将 NaN 值填充为 1
df['B'] = df['A'].fillna(1)
# 输出结果
print(df)
```
结果如下:
```
A B
0 1.0 1
1 2.0 2
2 NaN 1
3 4.0 4
```
这里使用 `fillna` 方法将列 A 中的 NaN 值填充为 1,然后将结果赋值给列 B。
希望这能解决你的问题,请尽管提出更多的问题,我会尽力回答。