量化投资：探究回测过拟合概率与CSCV框架

需积分: 0 170 浏览量更新于2024-06-30 1 收藏 2.41MB PDF 举报

"本文介绍了华泰证券关于人工智能系列研究的第二十二篇报告，主要关注基于CSCV（组合对称交叉验证）框架的回测过拟合概率问题。报告通过分析三组不同的量化研究案例，揭示了回测过拟合可能带来的误导性结论，并探讨了过拟合的两个层次：训练过拟合和回测过拟合。" 在金融领域的量化投资中，过拟合是模型性能评估中的一个重要问题。过拟合指的是模型在训练数据上表现良好，但在未见过的新数据（如回测或实盘阶段）上表现不佳的现象。报告详细阐述了过拟合的两个层次： 1. 训练过拟合：主要发生在机器学习模型中，模型在训练集上拟合过度，导致在测试集上的预测效果下降。解决训练过拟合通常可以通过选择合适的模型复杂度，如调整超参数或限制模型训练迭代次数，以及采用交叉验证等方法来改善。 2. 回测过拟合：这是量化投资领域特有的问题，模型在回测阶段显示出优秀的业绩，但在实际交易中却无法复制这些结果。回测过拟合可能源于市场环境的变化、对历史数据噪声的过度学习，或者过于依赖特定时期的数据特性。解决回测过拟合的策略通常包括使用多种量化指标来检验模型的稳健性，以及采用更严格的回测框架，如CSCV。报告列举了三个具体的案例： 1. 案例1涉及7种机器学习模型应用于多因子选股策略，结果显示大多数增强组合的回测过拟合概率（PBO）在15%~50%之间，这意味着报告中得出的“XGBoost表现最佳”的结论可能是由于回测过拟合造成的。 2. 案例2对比了6种交叉验证方法在多因子选股策略中的应用，多空组合的PBO处于20%~50%区间，暗示“分组时序交叉验证表现最佳”的结论同样可能受到回测过拟合的影响。 3. 案例3考察了双均线50ETF择时策略，发现某些参数组合的PBO高达50%~90%，这提示我们“参数组合[11,30]和[11,24]表现最佳”的判断可能基于回测过拟合。通过这些案例，报告强调了在量化投资中使用CSCV框架来估计回测过拟合概率的重要性，以提高模型的泛化能力和投资决策的可靠性。同时，报告也提醒投资者和研究者要警惕模型在回测阶段的优异表现可能并不意味着在实际交易中的成功，因此需要采取措施来控制和检测回测过拟合。

金工研究/深度研究 | 2019 年 06 月 17 日

谨请参阅尾页重要声明及华泰证券股票和行业评级标准 5

回测过拟合概率

过拟合的两个层次：训练过拟合和回测过拟合

华泰人工智能系列的多项研究探讨“过拟合”。在不同语境下，“过拟合”的含义有所不同。

我们认为过拟合可以分为两个层次：训练过拟合和回测过拟合。

训练过拟合是机器学习语境下偏狭义色彩的过拟合。它是指机器学习模型在训练集表现好，

在测试集表现差，如下图所示。训练过拟合的产生原因是模型超参数选择不当（如树集成

模型），或者模型过度训练（如神经网络模型）。训练过拟合的问题可被解决，解决方案是

采用合理的交叉验证方法选择模型超参数或者迭代次数。交叉验证方法在《人工智能 14：

控制过拟合：从时序交叉验证谈起》（20181128）和《人工智能 16：再论时序交叉验证控

制过拟合》（ 20190218）中有详细论述。

图表1：训练过拟合示意图

资料来源：华泰证券研究所

回测过拟合是量化研究语境下偏广义色彩的过拟合。它是指量化模型在回测阶段表现好，

在实盘阶段表现差，如下图所示。回测过拟合的产生原因在研究背景中已有论述，主要是

市场规律发生变化，或者源于模型对回测期数据噪音的过度学习。回测过拟合的问题难以

根除，相对合理的解决方案是测量回测过拟合的概率，以检验回测过拟合的程度。

图表2：回测过拟合示意图

资料来源：华泰证券研究所

0.5

1.5

2.5

100

110

120

130

140

150

160

170

180

190

200

单位：倍

时间

策略A

策略B

策略C

（样本外）回测阶段实盘阶段

“策略A优于策略B、C”的研究结论可能为回测过拟合

如何衡量回测过拟合的可能性？

剩余21页未读，继续阅读

我只匆匆而过

粉丝: 20
资源: 316

量化投资：探究回测过拟合概率与CSCV框架

量化投资：基于CSCV的回测过拟合概率分析

华泰证券：基于CSCV框架的量化回测过拟合分析

华泰证券人工智能系列：深入金融工程的机器学习应用

华泰证券人工智能系列01_机器学习_华泰证券人工智能系列01_金融工程_

投资回测过拟合概率的估计：组合对称交叉验证

20190617-华泰证券-华泰证券人工智能系列之二十二：基于CSCV框架的回测过拟合概率1

华泰人工智能系列下载1-41 从20170601到20211119

cscv452

CSCV变电站自动化系统实用PPT课件.pptx

2019 CVPR_ICCV_CSCV_ 3D Human Pose Estimation PAPER

最新资源