corrmat.nlargest
时间: 2023-08-13 08:03:50 浏览: 136
corrmat.nlargest()是一个pandas库中的函数,用于找出相关矩阵中最大的N个值。它的语法如下:
```python
corrmat.nlargest(n, col)
```
其中,n表示要找出的最大值的个数,col表示要查找的列。它将返回一个包含最大的N个值的DataFrame对象,按照降序排列。
相关问题
corrmat = train.corr() # 取 top10 k = 10 cols = corrmat.nlargest(k, 'price')['price'].index # 绘图 cm = np.corrcoef(train[cols].values.T) sns.set(font_scale=1.25) hm = sns.heatmap(cm, cbar=True, annot=True, square=True, fmt='.2f', annot_kws={'size': 10}, yticklabels=cols.values, xticklabels=cols.values) plt.show()
这段代码是用于绘制数据集中前10个与价格最相关的特征之间的相关性热力图。首先,通过train.corr()计算出训练集中各特征之间的相关系数矩阵corrmat。然后,取出与价格最相关的前10个特征的列名,并以此构建相关系数矩阵cm。最后,使用seaborn库中的heatmap函数绘制热力图,其中annot=True表示显示每个方格中的数值,fmt='.2f'表示数值保留两位小数,yticklabels和xticklabels分别表示y轴和x轴的标签。
这段代码运用了什么模型print("Skewness: %f" % train['SalePrice'].skew()) print("Kurtosis: %f" % train['SalePrice'].kurt()) #correlation matrix corrmat = train.corr() f, ax = plt.subplots(figsize=(12, 9)) sns.heatmap(corrmat, cmap='coolwarm', square=True) plt.show() k=10 re_cols = corrmat.nlargest(k, 'SalePrice')['SalePrice'].index train[re_cols] np.corrcoef(train[re_cols].values.T)
这段代码没有运用任何模型。
首先,代码使用了train['SalePrice'].skew()和train['SalePrice'].kurt()计算了SalePrice列的偏度和峰度。
接下来,使用了train.corr()函数计算了数据集中所有列之间的相关系数,并将结果保存到了一个名为corrmat的变量中。然后,使用了sns.heatmap()函数绘制了相关系数矩阵的热力图。
最后,使用了corrmat.nlargest(k, 'SalePrice')['SalePrice'].index函数选择了与SalePrice相关性最大的前k个特征,并使用了np.corrcoef()函数计算了这些特征之间的相关系数。
阅读全文