1.小样本学习基本理论
小样本学习(Few-Shot Learning,FSL)是一种新颖的机器学习方法,在过去两
年中流行起来,它旨在从少量的标记数据中学习。深度神经网络在大数据上取得了骄
人的成绩, 但在仅有少量样本时表现得不尽如人意,而在很多实际情况中,数据难以
取样或大量累积。为了解决该问题, 小样本学习被越来越多的研究者所关注。这一节,
我们主要介绍小样本的基本理论,包含小样本学习的定义和方法。
1.1.小样本学习的定义
随着大数据时代的到来,深度学习模型已经在图像分类、文本分类等任务中取得
了先进成果。一般来讲,深度学习的成功可以归结于三个关键因素:强大的计算资源、
复杂的神经网络和大规模数据集。
但是,由于诸如隐私,安全性或数据的高标签成本等一系列因素,许多现实的应
用场景(例如在医学,军事和金融领域)没有条件获取足够的带标签的训练样本,或
者需要消耗大量的时间和人力对无标签数据进行标注。面对这类问题,一个专门的机
器学习分支—小样本学习应运而生。
计算机程序基于与任务 T 相关的经验 E 进行学习,使用度量指标 P 得到改进。基
于此,小样本学习定义为:小样本学习是一类机器学习问题,其经验 E 中仅包含有限
数量的监督信息。总结起来,机器学习就是从数据中学习,从而使完成任务的表现越
来越好。小样本学习是具有有限监督数据的机器学习。
1.2.小样本学习在证券择时场景下的应用
证券交易的过程通常是以动态的方式完成,一次成功的交易一般包括两个步骤:
首先了解市场然后做出正确的决定。了解市场状况通常需要调查过去的时间序列数据,
这些数据通常是复杂的,不稳定的,并且存在很多不确定性。随着影响市场因素的增
多,精确地预测金融市场也变得愈加艰难。机器学习方法以其强大的非线性拟合能力
和灵活的结构设计,在金融场景的应用也越来越受到专业投资者的重视。
近年来,各种机器学习方法己经被广泛地应用到金融时间序列预测方面。这些基
于机器学习的方法往往是基于历史大样本数据进行训练,并且假设训练样本和预测样
本的分布是一致的。但是股市的分布其实并不稳定,在不同的时间段,其分布是不同
的。为了避免股市数据分布变化的问题,一个有效的方法是基于近期数据训练模型
(增加近期历史数据的训练权重)。然而由于近期数据样本量较少,模型容易欠拟合。
基于数据增强的小样本学习方法可以对训练数据进行扩充,使得机器学习模型尽可能
收敛。
量化投资策略的主要思想是利用证券价格的历史趋势来判断证券的未来价格,并
制定相应的投资策略。本文将讨论小样本学习策略在择时场景中的应用。择时策略
作为量化投资的策略之一,是通过对未来市场走势的判断,增加或减少某一特定资
产仓位的投资策略。其目的是通过对未来走势的判断,改变持仓仓位,从而获取相
对于基准的超额收益。
在下一节中,本文将介绍一种新颖的基于小样本学习的择时策略框架。