dataframe某列值清洗
时间: 2023-11-18 11:52:03 浏览: 107
pandas数据清洗,排序,索引设置,数据选取方法
你可以使用 pandas 库来清洗 DataFrame 中某一列的值。下面是一个示例代码,演示了如何使用正则表达式(regex)来清洗某一列的值:
```python
import pandas as pd
import re
# 创建一个示例 DataFrame
data = {'col1': ['apple', 'banana', 'orange', 'grape'],
'col2': ['123', '$456', '789%', '10.5']}
df = pd.DataFrame(data)
# 清洗 col2 列的值
df['col2'] = df['col2'].apply(lambda x: re.sub(r'[^0-9.]', '', x))
print(df)
```
在上述代码中,我们使用了 `re.sub()` 函数,它用空字符串替换了 col2 列中的非数字和小数点字符。这样,我们就得到了一个清洗后的 DataFrame。
请注意,上述代码仅仅是一个示例,具体的清洗逻辑可能因你的数据而异。你可以根据实际需求修改正则表达式或其他处理方式来满足你的清洗需求。
阅读全文