模型评估：数据集切分与K Fold交叉验证

需积分: 0 162 浏览量更新于2024-08-05 收藏 657KB PDF 举报

"模型评估1 - 数据集切分与scikit-learn库的使用，包括train_test_split函数和KFold交叉验证" 在机器学习中，评估模型的性能是至关重要的，这涉及到对数据集的合理划分。scikit-learn是一个强大的Python库，它提供了丰富的工具来处理数据和构建模型，其中包括数据集切分和模型评估的方法。在这个主题中，我们将关注`train_test_split`函数和`KFold`类，它们都是scikit-learn中的关键组件。 1. **数据集切分** 数据集通常被划分为训练集和测试集，以便在不泄露未来测试数据的情况下训练模型。训练集用于学习模型参数，而测试集则用于评估模型在未见过的数据上的表现。`train_test_split`函数是scikit-learn中用于执行这种切分的工具。 - **train_test_split函数**： - **参数**： - `arrays`：包含多个数组，这些数组将被一起切分。 - `test_size`：定义测试集的大小，可以是浮点数或整数，表示数据集中测试集所占比例或具体大小。 - `train_size`：定义训练集的大小，与`test_size`类似。 - `random_state`：设置随机数种子，确保每次切分的结果可复现。 - `stratify`：如果提供，将进行分层采样，确保每个类别在训练集和测试集中保持相同的分布。 2. **KFold类** - **KFold交叉验证**： - `KFold`类实现了折交叉验证（k-Fold Cross-Validation），这是一种常用的评估模型性能的方法。它将数据集分成k个互斥的子集，其中k-1个子集用于训练，剩下的一个子集用于测试，这个过程重复k次，每次换一个不同的子集作为测试集。最后，模型的性能是所有测试结果的平均值。 - **使用方式**： - `KFold(n_splits=3, shuffle=False, random_state=None)`： - `n_splits`：定义折叠的数量，即数据将被分成多少份。 - `shuffle`：如果为True，会在切分前打乱数据顺序。 - `random_state`：同样用于控制随机性，确保每次切分可复现。通过这样的数据切分和交叉验证，我们可以更准确地估计模型在未知数据上的泛化能力。在实践中，根据问题的特性和数据量，我们可能选择不同的切分策略，如80/20的训练/测试分割，或者使用5-折或10-折交叉验证。 `train_test_split`和`KFold`是scikit-learn中用于模型评估的重要工具。理解并正确使用它们对于优化模型性能和避免过拟合至关重要。在实际应用中，还需要根据项目需求选择合适的参数，并结合其他评估指标，如准确率、召回率、F1分数等，全面评价模型的表现。

2022/4/27 4.model_select

huaxiaozhuan.com/工具/scikit-learn/chapters/4.model_select.html 3/12

便利函数 cross_val_score

对 estimator

执行 k

折交叉验证。其原型为：

返回值：返回一个浮点数的数组。每个浮点数都是针对某次

折交叉的数据集上，

estimator 预测性能得

分。

参数：

estimator ：指定的学习器，该学习器必须有 .fit 方法来进行训练。

X ：样本集合。通常是一个 numpy array ，每行代表一个样本，每列代表一个特征。

y ：样本的标签集合。它与 X

的每一行相对应。

groups ：样本的分组标记集合。它与 X

的每一行相对应，用于训练集、测试集的拆分。

scoring ：一个字符串，或者可调用对象，或者 None ，它指定了评分函数。

如果为可调用对象，则参数为 estimator, X, y

，返回值为一个浮点数表示预测能力得分。

如果为 None ，则采用 estimator 学习器的 .score 方法。

如果为字符串，则可以为下列字符串：

'accuracy' ：采用的是 metrics.accuracy_score 评分函数。

'average_precision' ：采用的是 metrics.average_precision_score 评分函数。

f1 系列：采用的是 metrics.f1_score

评分函数。包括：

'f1' ： f1

值作为评分。用于二分类问题。

'f1_micro'

：微 f1

值作为评分。用于多分类问题。

'f1_macro' ：宏 f1

值作为评分。用于多分类问题。

'f1_weighted' ：加权

值作为评分。

'f1_samples'

：多标签 f1

值作为评分。

'log_loss' ：

采用的是 metrics.log_loss 评分函数。

precision 系列：采用的是 metrics.precision_score 评分函数。

具体形式类似 f1 系列。

recall

系列：采用的是 metrics.recall_score 评分函数。

具体形式类似 f1 系列。

'roc_auc' ：采用的是 metrics.roc_auc_score

评分函数

。

'adjusted_rand_score' ：采用的是 metrics.adjusted_rand_score

评分函数。

'mean_absolute_error' ：采用的是 metrics.mean_absolute_error

评分函数。

'mean_squared_error’' ：采用的是 metrics.mean_squared_error

评分函数。

'median_absolute_error' ：采用的是 metrics.median_absolute_error

评分函数。

'r2' ：采用的是 metrics.r2_score

评分函数

。

cv ：一个整数、

折交叉生成器、一个迭代器、或者 None ，指定 k

折交叉参数。

如果为 None ，则使用默认的

折交叉生成器。

如果为整数，则指定了

折交叉生成器的

值。

sklearn.model_selection.cross_val_score(estimator, X, y=None, scoring=None, cv=None,

n_jobs=1, verbose=0, fit_params=None, pre_dispatch='2*n_jobs')

剩余11页未读，继续阅读

亚赛大人

粉丝: 34
资源: 332

模型评估：数据集切分与K Fold交叉验证

博途1200恒压供水程序，恒压供水，一拖三，PID控制，3台循环泵，软启动工作，带超压，缺水保护，西门子1200+KTP1000触摸屏

基于PLC的立体车库，升降横移立体车库设计，立体车库仿真，三层三列立体车库，基于s7-1200的升降横移式立体停车库的设计，基于西门子博图S7-1200plc与触摸屏HMI的3x3智能立体车库仿真控制

锂电池化成机 姆龙NJ NX程序，NJ501-1400，威伦通触摸屏，搭载GX-JC60分支器进行分布式总线控制，ID262.OD2663等输入输出IO模块ADA801模拟量模块 全自动锂电池化成分容

西门子Siemens PLC程序，博途V16 V17版，配方程序，RS485通讯控制变频器启停及速度控制，昆仑通态屏与1200通讯S7~1200为cPU为1214，屏采用为mgcS，程序案例

c3560c405-universalk9-mz.150-2.SE.bin

基于感知的H.264/AVC视频编码速率控制算法

共享打印机问题修复补丁

2024 DevOps 学习路线图

基于预训练卷积神经网络的时间池化深度特征无参视频质量评估方法

基于Python+Django的在线音乐网站设计与实现源码+数据库（毕业设计项目）

最新资源

锂电池化成机姆龙NJ NX程序，NJ501-1400，威伦通触摸屏，搭载GX-JC60分支器进行分布式总线控制，ID262.OD2663等输入输出IO模块ADA801模拟量模块全自动锂电池化成分容