动态模型池策略:基于LGBM的机器学习选股方法

需积分: 0 2 下载量 98 浏览量 更新于2024-06-30 收藏 2.17MB PDF 举报
本篇报告是德邦证券2022年5月24日发布的金融工程专题系列中的第五篇,标题为“基于模型池的机器学习选股”。报告深入探讨了一种动态的量化投资策略,利用机器学习来优化因子选择和模型集成。 首先,报告介绍了一个关键的方法论,即构建和筛选因子库。这包括构建一系列经济和金融相关的指标(因子),如财务指标、风格因子等,这些因子被认为是影响股票表现的重要因素。筛选过程分为几个步骤: 1. **因子筛选模型**:使用了LGBM(LightGBM)模型,这是一个高效的梯度提升算法,它能够提供因子的重要性评估,通过分析训练集特征重要性,剔除不显著或贡献度低的因子,从而提高筛选效率。 2. **筛选频率**:通过验证集数据进行动态调整,不仅筛选因子,也评估模型性能。这种方法避免了频繁地训练新模型,节省了计算资源。 3. **因子预筛选**:预先设定筛选规则,例如对因子更新频率和历史表现的要求,进一步加速了筛选过程。 其次,报告强调了模型池的运用。模型池是一个动态结构,每当训练出新的机器学习模型,就会加入其中。模型池允许分析师观察和利用不同模型在不同时间点的性能,捕捉因子的轮动效应。这种策略的优点在于: - **避免过度拟合**:通过长期观察,模型池可以适应市场的变化,防止因为短期市场状态导致的模型失效。 - **长记忆能力**:早期训练的模型能反映更长时间段的市场趋势,因此,规模较大的模型池通常能提供更稳定和全面的投资视角。 - **实时更新**:模型池中的模型不是一次性训练后固定不变,而是随着新数据的累积而不断优化。 最后,报告指出,在实际操作中,选取近期表现良好的模型进行选股,而非每次都从头训练模型,这样可以在保持模型稳定性的前提下,显著减少计算成本。通过这种方法,德邦证券金融工程团队试图捕捉机器学习在选股策略中的非线性效应,并利用模型间的互补性,提高投资组合的回报率。 整个研究过程展示了如何结合金融工程和机器学习技术,以一种动态、高效的方式来构建和优化投资策略,以应对不断变化的金融市场环境。