NHS-R社区指导：TidyModels与Recipes构建机器学习模型

需积分: 10 146 浏览量更新于2024-12-10 收藏 14.68MB ZIP 举报

在当前的数据科学领域中，TidyModels是一种流行的建模框架，它与数据处理流程中的"食谱"方法相结合，为创建可重复、高效和可扩展的模型提供了一种标准化的路径。本次NHS-R社区的网络研讨会专注于TidyModels框架的最新进展，以及如何在实践中应用它来构建机器学习模型，特别是针对NHS（英国国家健康服务）数据集。 ### TidyModels框架 TidyModels是R语言中用于机器学习模型开发的一系列包和工具的集合，其核心理念是使模型的创建和管理过程尽可能整洁、符合数据科学的最佳实践。TidyModels鼓励用户遵循“tidy”的原则，即数据集应该整洁，处理数据的代码应该清晰、易于理解。该框架中主要包含的组件有： - **配方（Recipes）**: 提供了一种系统的方法来创建数据转换，并且这些转换可以与模型训练过程紧密集成。使用配方，用户可以指定如何对数据进行预处理，例如标准化变量、编码类别、创建多项式特征等，以准备用于预测模型。 - **RSample**: 用于数据拆分和交叉验证的方法，为机器学习实验设计提供了坚实的基础。通过RSample，可以轻松地对数据集进行分层抽样、分割训练集和测试集等操作。 - **防风草（Parsnip）**: 一个统一的模型接口，允许用户以一致的方式指定、设置和评估不同的模型。Parsnip使得在不同模型之间切换变得更加容易，因为它抽象了模型的特定语法。 - **Tune**: 提供了一套工具来自动化超参数优化过程，帮助改善模型性能。通过Tune，可以高效地搜索最佳的模型参数。 - **Yardstick**: 用于评估模型性能的工具，提供了许多评估指标，比如准确率、召回率、精确度等。Yardstick与TidyModels框架中的其他部分协同工作，使得评估模型的过程既方便又高效。 ### NHS-R社区网络研讨会内容本次研讨会的目标是向参与者传授TidyModels框架的基础知识，并通过实际案例演示如何快速开发可扩展的模型。议程包括： - **从头开始构建ML分类模型**：介绍如何使用TidyModels框架从零开始构建机器学习分类模型的基本步骤。 - **数据预处理**：利用Recipes软件包对数据进行预处理，确保数据准备好用于构建预测模型。这包括数据清洗、特征工程等关键步骤。 - **数据拆分与交叉验证**：使用RSample包来进行数据的拆分和交叉验证，这是机器学习中确保模型泛化能力的重要环节。 - **建立基线模型**：通过Parsnip建立模型的基线，这是一个快速迭代和比较不同模型原型的起点。 - **超参数调整**：利用Tune软件包进行超参数调优，以改进模型性能。 - **模型评估**：使用Yardstick对模型进行评估，确保模型的预测性能满足标准。 ### 实际案例为了更具体地展示TidyModels框架的应用，本次研讨会将使用NHS数据集来处理特定问题。这将展示如何将理论知识应用于实际场景，解决医疗保健领域中的问题。 ### 阅读材料和资源参与者也被鼓励查看之前关于使用Caret包的网络研讨会材料，这是R语言中另一个流行的机器学习工具包，虽然本次研讨会上TidyModels框架将作为主要工具。 ### 结论通过本次NHS-R社区网络研讨会，参与者将获得有关如何使用TidyModels框架创建、评估和优化机器学习模型的实战经验。这一框架不仅仅是构建模型的工具集合，它还代表了一种更加严谨、系统且可复制的数据科学工作流程，使得数据分析和模型开发更加高效和有效。

资源目录

收起资源包目录

NHS-R社区指导：TidyModels与Recipes构建机器学习模型（24个子文件）

Improving_a_TidyModel_for_classification.html 1.1MB

TidyModelsBanner.png 15KB

Building_a_TidyModel_for_classification_from_scratch.html 4.51MB

Stranded_Data.csv 39KB

hyperparameter_tree.png 44KB

.Rhistory 14KB

log_reg_roc_plot.png 36KB

Building_a_TidyModel_for_classification_from_scratch.Rmd 13KB

NHSR.png 6KB

stranded_data.rdata 243KB

LICENSE 1KB

Improving_a_TidyModel_for_classification.Rmd 11KB

Building_a_TidyModel_for_classification_from_scratch_full_tutorial.html 4.65MB

kfold.png 24KB

VarImp.png 30KB

Building_a_TidyModel_for_classification_from_scratch_full_tutorial.Rmd 23KB

ConfusionTableR.png 23KB

README.html 781KB

tuned_tree.png 36KB

README.md 2KB

tidymodels.png 116KB

.RData 12.71MB

p_val_plot.png 61KB

Getting Started With stacks • stacks.pdf 936KB

共 24 条

林文曦

粉丝: 36

NHS-R社区指导：TidyModels与Recipes构建机器学习模型

打造简易物品配方：使用wurst-item-recipes教程

Rails Recipes: Expert Solutions for Real-World Web Applications

Rails_Recipes:早期预览版：敏捷开发者必读

hansen-m-recipes:我的Autopkg食谱-https

recipes:烹饪食谱存储库-因为并非所有内容都是代码

fari-recipes-qts-aarch64:Fari食谱集合-适用于AArch64版本QTS

Recipes:Web应用程序基础-作业3（带有API和DOM的Express App）

phenomeforce_tidymodels:整理模型的Phenome Force讲习班

react_kodbazis_recept_app：React JsKodbázis-接收应用程序gyakorlás

最新资源