import warnings warnings.filterwarnings("ignore") %matplotlib inline sns.distplot(train_data['V0'],fit=stats.norm) ax=plt.subplot(1,2,2) res = stats.probplot(train_data['V0'], plot=plt) ax=plt.subplot(train_rows,train_cols,i) sns.distplot(train_data[col],fit=stats.norm) res = stats.probplot(train_data[col], plot=plt) ax = sns.kdeplot(train_data['V0'], color="Red", shade=True) ax = sns.kdeplot(test_data['V0'], color="Blue", shade=True) ax = ax.legend(["train","test"]) sns.regplot(x='V0', y='target', data=train_data, ax=ax, scatter_kws={'marker': '.', 's':3, 'alpha':0.3}, line_kws={'color': 'k'} ); sns.distplot(train_data['V0'].dropna()) ax = sns.kdeplot(train_data[col], color="Red", shade=True) sns.regplot(x=col, y='target', data=train_data, ax=ax, scatter_kws={'marker':'.','s':3,'alpha':0.3}, line_kws={'color':'k'}); data_train1 = train_data.drop(['V5','V9','V11','V17','V22','V28'],axis=1) train_corr = data_train1.corr() train_corr 解释每一行代码的意思
时间: 2024-01-01 16:04:24 浏览: 165
logging_warnings_codes.py
这段代码涉及到了Python数据分析和可视化的相关库,主要作用是对训练数据进行分析和可视化。
1. `import warnings`:导入Python的警告模块。
2. `warnings.filterwarnings("ignore")`:忽略所有的警告信息。
3. `%matplotlib inline`:使用Jupyter Notebook的魔法命令,将matplotlib绘制的图形显示在notebook页面中。
4. `sns.distplot(train_data['V0'],fit=stats.norm)`:使用seaborn库绘制训练数据集中'V0'这一列的直方图,并拟合正态分布曲线。
5. `ax=plt.subplot(1,2,2)`:在当前图形中添加一个子图,子图为1行2列,当前子图为第2列。
6. `res = stats.probplot(train_data['V0'], plot=plt)`:使用scipy库绘制训练数据集中'V0'这一列的概率图。
7. `sns.distplot(train_data[col],fit=stats.norm)`:使用seaborn库绘制训练数据集中某一列的直方图,并拟合正态分布曲线。
8. `res = stats.probplot(train_data[col], plot=plt)`:使用scipy库绘制训练数据集中某一列的概率图。
9. `ax = sns.kdeplot(train_data['V0'], color="Red", shade=True)`:使用seaborn库绘制训练数据集中'V0'这一列的密度图。
10. `ax = sns.kdeplot(test_data['V0'], color="Blue", shade=True)`:使用seaborn库绘制测试数据集中'V0'这一列的密度图。
11. `ax = ax.legend(["train","test"])`:给密度图添加图例。
12. `sns.regplot(x='V0', y='target', data=train_data, ax=ax, scatter_kws={'marker': '.', 's':3, 'alpha':0.3}, line_kws={'color': 'k'})`:使用seaborn库绘制训练数据集中'V0'这一列与'target'列之间的回归关系图。
13. `sns.distplot(train_data['V0'].dropna())`:使用seaborn库绘制训练数据集中'V0'这一列的直方图,并删除缺失值。
14. `ax = sns.kdeplot(train_data[col], color="Red", shade=True)`:使用seaborn库绘制训练数据集中某一列的密度图。
15. `sns.regplot(x=col, y='target', data=train_data, ax=ax, scatter_kws={'marker':'.','s':3,'alpha':0.3}, line_kws={'color':'k'})`:使用seaborn库绘制训练数据集中某一列与'target'列之间的回归关系图。
16. `data_train1 = train_data.drop(['V5','V9','V11','V17','V22','V28'],axis=1)`:删除训练数据集中'V5'、'V9'、'V11'、'V17'、'V22'、'V28'这6列,并将处理后的数据集赋值给data_train1变量。
17. `train_corr = data_train1.corr()`:计算data_train1中各列之间的相关系数,并将结果保存到train_corr变量中。
阅读全文