北京物流信息联盟

【多因子研究合辑】多因子模型系列报告:利用纯因子组合检验因子有效性

2021-07-19 14:18:56

报告要点


纯因子组合对模型中某个因子具有单位暴露度,对其他因子暴露度为0
纯因子组合对模型中某个因子具有单位暴露度,对其他因子暴露度为0,对因子显著性检验、投资收益事后分析和多因子组合构建均有重要作用。
纯因子组合避免了传统的排序多空组合可能无意识暴露到其它因子上的问题
检验因子效用的通常做法是将股票按照因子值分作多头组合和空头组合,然后观察这个多/空组合的历史收益,然而这样做的弊端是该多空组合有可能对其他因子有较多未意识到的暴露,比如检验流动性因子或成长性因子时其实较多暴露在了规模因子上。纯因子组合是控制了对其他因子的暴露度后的多/空投资组合,考察其历史收益会更有说服力。
从风险收益比来看,流动性因子历史表现最佳,反转因子和规模因子次之
流动性因子风险收益比为2.24,反转和规模因子风险收益比为1.64 和1.50。




一、 构造纯因子组合



本系列的第一篇报告《多因子模型系列报告之一 ---- 模型理论随想和纯因子组合构建》已经详细说明了本篇报告所需要的诸如模型的解、因子暴露度、纯因子组合等概念。之后的主要内容是展示如何使用纯因子组合检验因子有效性。检验因子效用的通常做法是将股票按照因子值分作多头组合和空头组合,然后观察这个多/空组合的历史收益,然而这样做的弊端是该多空组合有可能对其他因子有较多未意识到的暴露,比如检验流动性因子或成长性因子时会较多暴露于规模因子上。纯因子组合是控制了对其他因子的暴露度后的多/空投资组合,考察其历史收益会更有说服
力。



二、 计算因子值的细节和模型具体形式






1合成大类风格因子



决定是否将因子加入模型应当首要考虑因子间的共线性问题,向模型中加入一个共
线性的因子对模型的伤害要远大于因子自身带来的信息的价值(详见系列报告一)。为
了克服共线性,益将描述股票同一类性质的多种因子合成大类因子,此处分别为成长、
EP、BP、流动性、规模、非线性规模、beta、残差波动率、反转、动量、质量,合成
方式见表1。

各子类因子详细描述如下:

成长因子

1/3 每股营收同比增速 + 1/3 每股收益同比增速 +1/3 一致预期净利润增速

每股营收同比增速: 最近报告期比上一年度同类报告期营业收入;

每股收益同比增速:最近报告期比上一年度同类报告期eps;

一致预期净利润增速:wind 一致预期。

EP 因子


PE-ftm: wind 一致预期

BP 因子

1/PB 最近报告期

流动性因子

1/3 近21 交易日 + 1/3 近63 交易日 + 1/3 近252 交易日 平均换手率的自然对数


规模因子

ln(流通市值)

非线性规模因子

非线性规模因子是规模因子的3 次方,然后经过施密特正交化处理,以去掉共线性的部分,非线性规模因子主要强调市值中等的股票。

非线性规模因子的计算公式为:


其中, s 是规模因子, nls 是非线性规模因子, cs 是规模因子的3次方。

Beta 因子

通过时间序列回归计算beta:


其中,收益率均为扣除无风险收益率后的收益。通过广义最小二乘法(GLS)计算beta 值,数据取过去252 个交易日的日收益率数据,回归权重为指数衰减加权,半衰期63 个交易日。

残差波动率

计算beta 因子时的残差序列的标准差。

动量

过去两年(扣除最近1 个月)的对数收益率的加权平均:


权重为指数衰减加权,半衰期126 个交易日。



从子类因子合成为大类因子的方式是:先对各个子类因子值进行极值处理(±5% winsorization),再计算z-score,然后将各子类因子的z-score 按表中权重合成为大类因子值,并再一次对合成得到的大类因子值正态标准化,作为最终的因子暴露值。

大类因子值正态标准化的方式也有讲究:

这种标准化方式可以使以流通市值为权重(基准组合)的投资组合是对所有风格因子0 暴露的。基准组合对各个因子的因子暴露为0,非零的因子暴露度就是投资组合偏离了基准组合多少倍标准差。


2模型的具体形式


我们采用的模型将收益分解为截距项因子、行业因子(哑元)和风格因子:


并有限制条件:

加入截距项的好处是让求解出的纯因子组合的权重之和一定为0(现金中性),加入beta 因子的好处是可以构建beta 中性的纯因子组合。



三、纯因子组合的历史收益



在历史样本中回测观察各个因子对应的纯因子组合收益,解决了通常的排序多/空组合同时对其它因子暴露的弊端,可以更具说服力的检验一个因子是否有效。下面分别考察截距项因子、纯风格因子、纯行业因子和残差项的历史收益情况。



1回测时间和样本空间



回测时间为2005 年1 月至2016 年4 月共计136 个月份,每月计算各因子对应的纯因子组合,并计算它们的收益。由于只是检测因子的有效性,而非真实可投资的组合(多空组合无法真实投资),故未考虑任何成本。样本空间为回测时间点非ST、非停牌的全部A 股。



检验共线性的方法除了观察相关系数外,还可以计算VIF 值和方差分解比例,方法见《系列报告一》。



2截距项因子收益



截距项因子收益 对应的组合是基准组合,基准组合对各风格因子的暴露均为0。如果风险因子解释力充分,因子收益fc 的累计收益应该和市值加权指数(基准)的收益十分接近,与中证全指对比如图2。


3纯风格因子组合的收益



风格因子对应的纯因子组合,对截距项暴露为0(零额投资或叫现金中性),即组合为多空组合,且多头/空头为100/100,对各行业因子暴露为0(在各行业中也是零额投资),对其他风格因子暴露为0,对自身风格因子偏离基准组合1 个标准差。此处展示成长、EP、BP、流动性、规模、非线性规模、beta、残差波动率、反转、动量、质量等11 个风格因子的纯因子收益。

通过t 值来检验观察到的各纯因子收益率是否显著不为零,并计算历史上发生|t|>2的次数所占比例来考察因子对股价产生影响的稳定性,这种影响若是完全随机的,那么占比应该小于5%。通过t>2 和t<-2 分别占比,来体现因子对股价在同一方向上的影响的持续性。

选取的各风格纯因子组合均能超越基准组合,流动性、规模纯因子、反转因子组合超额收益明显高于其他因子。波动率方面,规模因子最大,成长因子最小。综合起来,流动性因子的信息比率是最高的。在因子同方向持续性方面,流动性、规模、反转出现 t<-2 的概率和BP、成长出现 t>2 的概率都较高,持续性也十分优秀。具体数据见表3和图3 到图14。


各风格因子收益曲线(图3 -- 14):








4纯行业因子组合的收益



行业因子对应的纯因子组合对本行业暴露为1(即权重100%),对截距项暴露为0(零额投资,100%自身行业多头,同时100%基准组合空头,即行业因子收益本身就是超额收益),对各个风格因子暴露为0。考察28 个申万一级行业的因子收益,可以了解在控制风格暴露后,各行业的收益情况。


总体来说,在控制了风格因子之后,医药、有色、食品饮料和计算机贡献较高超额收益,而钢铁、交运、公用事业和轻工没有超额收益。从波动率可以看出,行业因子收益的轮动更加频繁和难以把握(可能是因为行业属性比风格因子属性更显而易见,price-in 越快)。各纯行业因子的收益曲线见附录I。

5残差项的收益和模型的解释力




a. 检验各纯因子组合中不能被模型解释的收益是否相互抵消。对各纯因子组合,计算残差项收益Wu'*r,各月平均值见表5。


b. 模型解释力


模型的调整R 方的均值为0.25±0.11,也就是说大概股票收益率和模型对收益的解释结果之间的相关系数大约为0.5, 其余部分均为模型无法解释的部分。以调整R方最大的2014 年12 月(R2-adj = 0.69)和最小的2014 年4 月(R2-adj = 0.065)来具体展示。


表5 和图16、图17 说明,虽然模型的解释力有限(被解释的收益和实际收益在相关系数在0.25 到0.73 之间),但只要组合充分分散,不能被解释的部分能够相互抵消,不用做特别处理。但若是集中持股,多因子模型的特异性收益率带来的风险将上升。



四、纯因子组合风险特征



1纯因子组合的历史波动率





计算样本区间内各因子的年化波动率(图18),可见,截距项因子的波动率(即市场波动率)最大,成长因子的波动率最小,除规模因子外,纯风格因子组合的波动率普遍小于纯行业因子组合的波动率。市场因子、纯行业因子和规模因子贡献了大约90%的波动率,一个市场中性、行业中性的组合可以规避掉大部分风险。


2纯因子组合的协方差



当考虑运用均值-方差优化,将多种纯因子组合合成可投资的组合时,不仅要估计各组合各自的方差(4.1 节),还需要考察各纯因子组合间的协方差。由于我们展示的这个模型包含有40 个因子,即含有40*40=1600 个协方差,数量较多,为了展示的便利,我们采用热力图和3D 热力图来观察协方差矩阵的特征,如图19 和图20。


从以上两图可以看出,方差和协方差的来源也主要来自市场和行业因子,风格因子
收益之间的协方差相对平坦。另外,有趣的是,纯银行因子组合和纯非银因子组合的收
益,与大部分其他纯因子组合的收益的协方差都小于零。


五、检验一些常见因子



以上罗列的风格因子至少大约可以解释掉50%(模型R2≈0.3)的收益来源,如果另外的某个因子和这些因子相关度较高,;另一方面,如果因子的方向和这些因子相反(正序或逆序),或者这个因子和这些因子之间有复杂的相关性而变为噪音,那有可能该因子的收益会被原来的因子掩盖掉,。

1被排序法高估的因子





个股乖离度

个股乖离度与反转因子相关度高,在纯因子组合中剔除了反转因子的效用后,因子收益率有明显降低。

a.与各风险因子相关系数

b. 因子收益

换手率变化

换手率变化是近 20 日换手率与近60 日换手率之比值。该因子相关度与反转因子相关性较高,并和流动性因子有些许相关,在纯因子组合中,因子收益率有明显降低。

a.与各风险因子相关系数

b.因子收益

10 日RSI

该因子相关度与反转因子相关性较高,在纯因子组合中,因子收益率有明显降低。

a.与各风险因子相关系数


b.因子收益


固定资产周转率

该因子与质量因子相关性较高,在纯因子组合中,因子收益率有明显降低。
a.与各风险因子相关系数

b.因子收益

现金比率

该因子相关度与质量、规模因子相关性较高,在纯因子组合中,因子收益率有明显降低。
a.与各风险因子相关系数

b.因子收益

每股自由现金流量比eps

该因子与各常见风格因子均不高,在控制了风格因子后,因子收益减少,但因子收益与原排序组合的相关性较高,可以体现出这部分是独立的因子收益。

a.与各风险因子相关系数

b.因子收益

个股股东数

该因子有严重规模因子暴露,并有PB、流动性等复杂关系的干扰,剔除风格因子
贡献后的纯因子组合中,超额收益大幅减少。

a.与各风险因子相关系数

b.因子收益


流动比率

该因子严重暴露到质量因子上,并有一定规模因子暴露,在剔除风格因子贡献后的纯因子组合中,几乎没有超额收益。

a.与各风险因子相关系数


b.因子收益


总市值比Ebitda

该因子暴露到PB、PE 因子上,在剔除风格因子贡献后的纯因子组合中,同样几乎没有超额收益。

a.与各风险因子相关系数


b.因子收益


股东权益比

该因子很大程度暴露到质量上,并有一定规模因子暴露,在剔除风格因子贡献后的纯因子组合中,甚至体现出负的超额收益。

a.与各风险因子相关系数


b.因子收益


应付账款占比

该因子有些许暴露到质量和规模因子上,在剔除风格因子贡献后的纯因子组合中,同样体现出负的超额收益。

a.与各风险因子相关系数


b.因子收益


表6 为以上各因子的纯因子组合和排序多空组合的IR 对比。虽然排序法高估了个股乖离度因子和换手率变化因子的收益,但通过构建纯因子组合,它们的IR 有所提升,仍不失为是优秀的因子。10 日RSI 和固定资产周转率的IR 虽然降低,但仍然可以接受。而应收账款占比和股东权益比等因子在剔除了常见风格因子的贡献后已经完全失效。


2被排序法低估的因子





净利润增速(季度同比)

该因子与成长因子有些许相关性,与动量因子有细微的相关性,在控制了风格因子后,因子收益有少许增加,并且更加平稳,因子收益与原排序组合的相关性较高,可以体现出这部分是独立的因子收益。

a.与各风险因子相关系数


b.因子收益


三费占比

该因子与PB、PE 因子正相关,又与质量因子负相关;与规模因子负相关,又与成长因子负相关,多种因子对其产生方向不一的复杂影响。在剔除风格因子贡献后的纯因子组合中,体现出更加稳定的的因子收益。

a.与各风险因子相关系数


b.因子收益


送股比例

送股比例暴度到了低成长的股票上面,着有可能其排序多空组合的收益被低成长的股票(通常表现不好)掩盖。在剔除风格因子贡献后的纯因子组合中,因子收益遂体现出来。

a.与各风险因子相关系数


b. 因子收益


销售毛利率

该因子也有复杂的因子暴露:低PE、高PB、低beta,在剔除了这些风格因子暴露后,因子收益明显稳定许多。

a.与各风险因子相关系数


b. 因子收益


PE/G

该因子与风格因子相关性都较小,在剔除了风格因子暴露后,因子收益并没有太多改变,仅仅是稳定性增加,是不错的因子。

a.与各风险因子相关系数


b. 因子收益


存货周转率

该因子主要偏向于小PE、规模大的股票,在剔除了风格因子暴露后,因子收益并没有太多改变,仅仅是稳定性增加,是不错的因子。

a.与各风险因子相关系数


b.因子收益


每股自由现金流量比EPS

该因子的排序多空组合和纯因子组合反向,说明之前的一些因子暴露完全覆盖了因子本身的收益,在剔除了风格因子暴露后,该因子还稍微剩下一点超额收益。

a.与各风险因子相关系数


b.因子收益


表7 为以上各因子的纯因子组合和排序多空组合的IR 对比。净利润增速季度同比、三费占比和PE/G 这样的因子本身已经很优秀的因子,做了因子纯化之后IR 提升显著,更能体现因子本身带来的超额收益;送股比例、销售毛利率、存货周转率和每股自由现金流量比EPS 由于本身有一定风格偏差,导致本身超额收益被风格掩盖,因子纯化之后IR 也变得显著。



附录I---- 纯行业因子组合的收益




注:2014 年以前,申万传媒、计算机、通信取原申万信息设备、申万信息服务的平均
值。




风险提示:数理模型存在风险;历史收益不保证未来回报;回测模拟不代表真实情况。

证券研究报告《多因子模型系列报告之二:利用纯因子组合检验因子有效性》

对外发布时间:2016年10月24日

报告发布机构:长江证券研究所

参与人员信息

秦瑶    SAC编号:S0490513080002   邮箱:qinyao@cjsc.com.cn

邓越    邮箱:dengyue1@cjsc.com.cn

评级说明及声明

评级说明

行业评级:报告发布日后的12个月内行业股票指数的涨跌幅度相对于同期沪深300指数的涨跌幅度为基准,投资建议的评级标准为:看好:相对表现优于市场;中性:相对表现与市场持平;看淡:相对表现弱于市场。

公司评级:报告发布日后的12个月内公司的涨跌幅度相对于同期沪深300指数的涨跌幅度为基准,投资建议的评级标准为:买入:相对于大盘涨幅大于10%;增持:相对于大盘涨幅在5%~10%;中性:相对于大盘涨幅在-5%~5%之间;减持:相对于大盘涨幅小于-5%;无投资评级:由于我们无法获取必要的资料,或者公司面临无法预见结果的重大不确定性事件,或者其他原因,致使我们无法给出明确的投资评级。

重要声明

长江证券股份有限公司具有证券投资咨询业务资格,经营证券业务许可证编号:10060000。本报告的作者是基于独立、客观、公正和审慎的原则制作本研究报告。本报告的信息均来源于公开资料,本公司对这些信息的准确性和完整性不作任何保证,也不保证所包含信息和建议不发生任何变更。本公司已力求报告内容的客观、公正,但文中的观点、结论和建议仅供参考,不包含作者对证券价格涨跌或市场走势的确定性判断。报告中的信息或意见并不构成所述证券的买卖出价或征价,投资者据此做出的任何投资决策与本公司和作者无关。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可升可跌,过往表现不应作为日后的表现依据;在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告;本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。本公司及作者在自身所知情范围内,与本报告中所评价或推荐的证券不存在法律法规要求披露或采取限制、静默措施的利益冲突。本报告版权仅仅为本公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制和发布。如引用须注明出处为长江证券研究所,且不得对本报告进行有悖原意的引用、删节和修改。刊载或者转发本证券研究报告或者摘要的,应当注明本报告的发布人和发布日期,提示使用证券研究报告的风险。未经授权刊载或者转发本报告的,本公司将保留向其追究法律责任的权利。

免责声明

本公众平台不是长江证券研究所官方订阅平台。相关观点或信息请以“长江研究”公众平台为准。市场有风险,投资需谨慎。在任何情况下,本公众平台信息所表述的意见并不构成对任何人的投资建议,任何人不应单独依靠本公众平台中的信息而取代自身独立的判断,应自主做出投资决策并自行承担投资风险。

END





友情链接

Copyright © 2023 All Rights Reserved 版权所有 北京物流信息联盟