如何将datafram的某一列二值化
时间: 2024-02-29 21:51:25 浏览: 84
dataframe 按条件替换某一列中的值方法
3星 · 编辑精心推荐
可以使用 pandas 的 apply 函数和 lambda 表达式来实现将 DataFrame 的某一列二值化。
例如,将 DataFrame 的列 `col` 中所有小于等于阈值 `threshold` 的值设为 0,大于阈值的值设为 1:
``` python
import pandas as pd
# 创建示例 DataFrame
df = pd.DataFrame({'col': [1, 2, 3, 4, 5]})
# 定义阈值
threshold = 3
# 使用 apply 函数和 lambda 表达式实现二值化
df['col'] = df['col'].apply(lambda x: 0 if x <= threshold else 1)
# 输出结果
print(df)
```
输出结果为:
```
col
0 0
1 0
2 0
3 1
4 1
```
其中,`apply` 函数接受一个 lambda 表达式作为参数,该 lambda 表达式根据输入的值 `x` 返回 0 或 1,然后 `apply` 函数将这个返回值赋值给原 DataFrame 的对应位置。
阅读全文