python使用re正则表达式去除dataframe数据类型‘总价123-456(万/套)’中的字符串保留数字
时间: 2024-03-17 10:41:12 浏览: 41
python的re正则表达式实例代码
可以使用正则表达式匹配出字符串中的数字部分,再将其转换为float类型。可以使用pandas库中的apply函数配合正则表达式实现。
假设需要对DataFrame数据类型中名为‘price’的列进行处理,可以使用如下代码:
```python
import re
def get_price(row):
price_str = row['price']
pattern = re.compile(r'\d+\.?\d*') # 匹配数字部分
price = pattern.findall(price_str)[0] # 获取数字部分
return float(price)
df['price'] = df.apply(get_price, axis=1) # 对DataFrame应用函数
```
这段代码使用正则表达式匹配出字符串中的数字部分,然后将其转换为float类型返回。最后使用apply函数将此函数应用到DataFrame的每一行上,得到处理后的结果。
阅读全文