选股因子系列研究(八十八)——多颗粒度特征的深度学习模型:探索和对比

发表时间: 2023-09-21    来源:海通证券

【内容提要】

在本系列的前期报告中,我们分别单独使用低频和高频特征作为输入,训练得到了深度学习因子。并在接近2年的样本外跟踪期内,观察到了稳定优异的业绩表现。但是随着研究和交流的深入,新的问题也产生了。由于不同频率数据的存在,同一个特征可在多个频率上计算。那么,它们包含的信息是完全一样的,还是互有增益呢?为此,本文探索和对比了几类多颗粒度模型,并提出了一些行之有效的改进方案。
 
      从单颗粒度模型到多颗粒度模型。尽管使用单一的日度特征已经可以实现不俗的业绩,但更细颗粒度的特征依然有值得挖掘的有效信息。因此,本文引入了两类多颗粒度模型。(1)“多颗粒度输入,一次性训练”:将不同颗粒度的特征均作为模型输入,并通过独立的GRU提取序列信息;随后,将GRU的输出结果合并,再通过MLP得到最终的输出。(2)“单颗粒度训练,输出集成”:单独训练每一个颗粒度的特征,输出对标签的预测;在最终的推理阶段,集成不同颗粒度模型的输出。
 
      在不同标签长度、调仓周期和成交价格假设下,多颗粒度模型的Rank IC和年化多头超额收益,相比单颗粒度模型都得到了不同程度的提升。整体而言,输出集成方式的效果最好,10日标签对应的费前年化超额收益可达31.5%。
 
      双向AGRU多颗粒度模型。为缓解早期重要信息的遗忘问题,我们不仅引入了注意力机制,还将GRU模型从单向改为双向。即,分别按顺序和逆序学习特征序列,并提取信息。和传统的单向GRU相比,双向AGRU多颗粒度模型的Rank IC、ICIR和多头超额收益都得到了全面而稳定的提升。具体地,周均Rank IC超过0.12,Top10%和Top100组合的费前多头超额收益分别为33%和40%。
 
      微软亚研院在《Multi-Granularity Residual Learning with Confidence Estimation for Time Series Prediction》一文中,提出了多颗粒度残差学习网络。其核心理念是,将多个相同的模块叠加,形成整体网络架构,但每个模块只单独处理一个颗粒度的数据。从第二个模块起,输入的特征都需通过取残差的方式,剔除前一颗粒度已包含的信息,即,只保留该粒度特有的信息。每个模块都会输出该颗粒度下,对最终标签的预测。再将所有预测集成,作为最终的预测。
 
      将双向AGRU多颗粒度模型的输出值作为股票的收益预测,构建周度调仓的中证500和中证1000 AI增强组合。2017.01-2023.07,无成分股约束时,中证500和中证1000 AI增强组合分别取得15%-20%和25%-30%的年化超额收益。其中,2023年的YTD超额收益分别为10%-16%和15%-18%。添加80%成分股权重约束后,两个组合的超额收益分别下降5%-6%和2%-3%,至10%-15%和23%-27%。
 
      风险提示。市场系统性风险、资产流动性风险、政策变动风险、因子失效风险。

登录“e海智研”查看研报https://irs.haitong.com(白名单手机验证码登录)

   

 

选股因子系列研究(八十八)——多颗粒度特征的深度学习模型:探索和对比.pdf


声明

海通证券股份有限公司(以下简称“本公司”)发布的证券研究报告仅提供给本公司特定客户使用。本公司不会因接收或阅读本公司的证券研究报告而视其为客户。本海通证券官方网站(www.htsec.com)刊发的证券研究报告为经合法授权发布,本公司证券研究报告的授权刊载详见海通证券网站的相关业务公告。本公司郑重提醒公众投资者,请审慎使用从网络或其他媒体、机构获取的未经授权刊载或者转发的本公司证券研究报告。本公司的证券研究报告仅向特定客户传送,未经海通证券研究所书面授权,研究报告的任何部分均不得以任何方式制作任何形式的拷贝、复印件或复制品,或再次分发给任何其他人,或以任何侵犯本公司版权的其他方式使用。未经授权刊载或者转发证券研究报告的,应当承担相应的法律责任。在任何情况下,本公司证券研究报告均不构成对任何人的投资建议,本公司也不对任何人因使用本公司证券研究报告所载任何内容所引致的任何损失负任何责任。市场有风险,投资需谨慎。本公司所载的信息、材料及结论只提供特定客户作参考,不构成投资建议,也没有考虑到个别客户特殊的投资目标、财务状况或需要。客户应考虑本公司研究报告中的任何意见或建议是否符合其特定状况。任何机构或个人在决定投资前,务必审慎决策、自担风险。

关闭