#第 2步:计算 表NotFraud 的相关性 # 这里计算 除 fraud列 的剩余7列的相关性 corr_Fraud = Fraud.loc[:, Fraud.columns != 'fraud'].corr() # 查看计算结果 corr_Fraud
时间: 2024-03-24 15:39:04 浏览: 13
你可以使用 `corr()` 方法来计算相关性,如下所示:
```python
# 计算表Fraud的相关性
corr_Fraud = Fraud.loc[:, Fraud.columns != 'fraud'].corr()
print(corr_Fraud)
```
这将计算 `Fraud` 表中除 `fraud` 列以外的所有列(即剩余的七列)两两之间的相关性,并存储在 `corr_Fraud` 中。使用 `loc[]` 方法可以按标签选取行或列, `[:, Fraud.columns != 'fraud']` 表示选取所有行,并且选取除 `fraud` 列以外的所有列。最后使用 `print()` 函数输出相关性矩阵。
相关问题
#计算 表NotFraud 的相关性 # 这里计算 除 fraud列 的剩余7列的相关性,因为 fraud是标签不算特征 corr_NotFraud = ??? # 查看计算结果 corr_NotFraud
为了计算表NotFraud的相关性,需要先读取该表并删除"fraud"列,然后计算剩余7列之间的相关性。
可以使用pandas库来实现:
```python
import pandas as pd
# 读取表NotFraud
df_not_fraud = pd.read_csv("NotFraud.csv")
# 删除fraud列
df_not_fraud = df_not_fraud.drop(columns=["fraud"])
# 计算相关性
corr_NotFraud = df_not_fraud.corr()
# 打印计算结果
print(corr_NotFraud)
```
这个代码会输出一个7x7的矩阵,表示表NotFraud中除了fraud列之外的7个特征两两之间的相关性。
# 这里计算 除 fraud列 的剩余7列的相关性,因为 fraud是标签不算特征 corr_NotFraud = ??? # 查看计算结果 corr_NotFraud
为了计算表NotFraud的相关性,需要先读取该表并删除"fraud"列,然后计算剩余7列之间的相关性。
可以使用pandas库来实现:
```python
import pandas as pd
# 读取表NotFraud
df_not_fraud = pd.read_csv("NotFraud.csv")
# 删除fraud列
df_not_fraud = df_not_fraud.drop(columns=["fraud"])
# 计算相关性
corr_NotFraud = df_not_fraud.corr()
# 打印计算结果
print(corr_NotFraud)
```
这个代码会输出一个7x7的矩阵,表示表NotFraud中除了fraud列之外的7个特征两两之间的相关性。