boruta随机森林
时间: 2023-11-26 08:12:55 浏览: 41
引用中提到了boruta随机森林的特征选择过程和相关的操作流程。boruta随机森林是一种用于特征选择的方法,它可以帮助我们从大量的特征变量中选择出与目标变量相关的关键特征变量。在这个过程中,我们首先从训练集中提取出与目标变量相关的特征变量子集,然后使用随机森林进行特征选择,最终确定哪些特征变量是重要的,哪些是不重要的。
在引用中提到的操作流程中,我们首先将训练集和测试集进行拆分,然后使用boruta随机森林进行特征选择。在这个过程中,我们设置了一些参数,如pValue=0.01表示只考虑与目标变量显著相关的特征变量,mcAdj=T表示使用Monte Carlo调整方法来校正p值,maxRuns=300表示运行300次迭代来确定特征的重要性。
根据引用中的结果,boruta随机森林在进行了14次迭代后,确认了8个特征变量是重要的,包括AverageReadingCountsForEachSharing、FirstSharingRate、ReadingRate、TotalReadingCounts、TotalReadingCountsOfSharing和其他3个特征变量。同时,还确认了1个特征变量是不重要的,即ReadingFinishRate。
总结来说,boruta随机森林是一种用于特征选择的方法,它可以从大量的特征变量中选择出与目标变量相关的关键特征变量。在使用boruta随机森林进行特征选择时,我们需要设置一些参数,并根据结果确定哪些特征变量是重要的,哪些是不重要的。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [随机森林预测发现这几个指标对公众号文章吸粉最重要](https://blog.csdn.net/qazplm12_3/article/details/116618019)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]