人工智能选股策略:广义线性模型的探索与应用

需积分: 36 18 下载量 191 浏览量 更新于2024-07-19 1 收藏 2.56MB PDF 举报
"本文探讨了人工智能在股票投资中如何运用广义线性模型进行量化选股,结合了机器学习思想优化传统的多因子模型。" 在金融领域,尤其是股票交易,人工智能的应用已经成为一种趋势。广义线性模型(Generalized Linear Models, GLMs)是一种在多因子模型基础上扩展的统计方法,它在股票投资中被用来分析股票因子暴露与未来收益之间的关系。文章指出,多因子模型的基本原理是通过线性回归来预测股票收益,而引入机器学习的目的是为了进一步优化这一过程。 文章详细介绍了广义线性模型构建的步骤,包括特征和标签的提取、特征预处理、训练集的合成以及滚动训练。在每个月底,模型能够对所有股票的下期收益进行预测,并能将所有因子合并成一个综合的“因子”,用于后续的回测和策略构建。作者构建了基于不同市场基准(如沪深300行业中性、中证500行业中性)的选股策略,并通过回测结果评估模型的性能。 对于模型的评价,作者使用了信息系数(Information Coefficient, IC)和正确率等指标,并进行了参数敏感性分析。研究发现,滚动训练集长度为12至24个月时,模型的回测效果最佳;主成分分析中保留的主成分越多,模型表现越好;而在不同的市场基准下,选择不同比例的样本会产生不同的效果,如沪深300行业中性基准下全样本表现优秀,中证500行业中性基准下选取排名前20%的样本效果更优。 此外,文章还提到,正则化技术(如岭回归、Lasso回归、弹性网络)在此次研究中并未显著提升选股效果。原因可能是所使用的特征因子已经经过验证,且在预处理阶段已进行了去极值和标准化,减少了极端样本的影响,因此正则化的筛选作用不明显。 这篇文章深入探讨了如何将人工智能的广义线性模型应用到股票交易的量化策略中,通过参数优化和模型评估,提供了适用于不同市场环境的选股策略。这样的研究对于投资者理解和利用机器学习技术进行智能投资具有重要的参考价值。