文章背景及结论
选题背景
近年来,Hou et al. (2019a)的 q-factor 模型对 FF 五因子模型的抨击,引发了学术界关于资产定价模型的因子大战,同时 AI 在因子挖掘上的应用使得因子数量呈指数上升。在这个因子泛滥的时代,factor zoo 逐渐演变成 factor ocean,判断新因子是否在已有因子的基础上提供新息,需要建立更系统的评价体系。
Barillas 和 Shanken(2018)以及 Fama 和 French(2018)通过检验资产定价模型中加入新因子前后的 alpha 变化来衡量新因子的贡献。而面对高维因子库,目前已有 LASSO、PCA 等方法对原有因子库进行降维,但这些方法可能出现变量遗漏问题,同时没有适当的计量方法解决模型选择错误的问题。这意味着,简单的使用 LASSO 之类的模型来进行因子筛选并不可靠。
本篇报告推荐的《Taming the factor zoo》提供了一种在高维环境下缓解变量遗漏问题的新因子检验方法。
借鉴文章的方法,我们对技术因子进行逐步回归筛选有效因子,希望将文章方法从资产定价模型拓展到机器学习背景下的因子挖掘。
核心结论
文章(Taming the factor zoo)提出双重选择方法缩减因子库,并通过实证检验近年来文献提出的新因子。
文章得出的主要结论:第一,近年新提出的因子中,BETA、投资能力
(HXZ 的 IA)和盈利能力因子(Fama-French 的 RMW、HXZ 的 ROE)有显著贡献。同时对比不同基准模型,双重选择方法可以充分利用因子库中包含的信息,减小变量遗漏误差,进而更保守地评估新因子贡献。第二,随着时间递归地应用文章方法,可以对因子库进行缩减。第三,文章方法对于模型参数具有稳健性,其他机器学习的变量选择方法也与文章的实证结果相似。
本文将文章的方法应用于纯技术因子的评估,发现双重选择方法虽能在一定程度精简因子库,剔除部分相关性较高的因子,但效果不显著。由于文章方法基于随机贴现模型,其在纯技术因子库上的应用有待进一步研究。
核心模型
基础模型
随机贴现因子模型(SDF)
《Taming the factor zoo》一文是基于随机贴现模型提出的,随机贴现因子的载荷可以作为因子贡献的评价指标。随机贴现因子模型的推导如下,
对于任一时刻 t,随机贴现因子的定义为:
𝑡
𝑡+1
𝑚𝑡+1 = 1 − 𝑏𝑇𝑅
(1)
其中𝑅𝑡+1为横截面个股超额收益率,𝑏𝑡为 SDF 的回归系数。𝑏𝑡可由观察到的 d 个因子特征,假设 SDF 回归系数可以表示为:
𝑏𝑡 = 𝑣𝑡𝜆𝑡 (2)
其中𝑣𝑡(n*d)为个股因子值,需要横截面进行零均值化使𝐸(𝑣𝑡) = 0, 𝜆𝑡
(d*1)为时变系数。
将上式(2)带入(1),可得另一种 SDF 模型:
𝑡
𝑡+1
𝑚𝑡+1 = 1 − 𝜆𝑇 𝐹
(3)
其中𝐹𝑡 +1 = 𝑣 𝑇𝑅 为因子投资组合,也可理解为因子收益率。𝜆 就是 SDF
𝑡 𝑡 𝑡
的载荷。
根据随机贴现模型的定义:
𝐸[𝑚𝑡+1𝑅𝑡+1] = 0 (4)
将 SDF 定义带入上式可得:
𝐸((1 − 𝜆𝑇 𝐹 )𝑅
) = 0 (5)
𝑡 𝑡+1 𝑡+1
通过广义矩估计(Generalized method of moments)可得
𝑡
𝑓
𝑓
𝐸(𝑅) = 𝛾0 + 𝜆𝑇𝐶 , 𝐶
= 𝐶𝑜𝑣 (𝑅, 𝐹) (6)
因子的 SDF 𝑡
𝜆
载荷 和风险溢价都有重要但独特的经济解释,而
Cochrane(2009)提出 SDF 载荷作为因子库筛选的指标更合适。
遗漏变量偏差
《Taming the factor zoo》提出的方法主要是为了解决遗漏变量带来的偏差问题。遗漏变量指的是模型中遗漏了重要的因子,该问题将导致因子的载荷估计存在偏差,且更严重的是偏差的方向可正可负。
用简单多因子模型为例,假设 y 对𝑥1和𝑥2满足如下线性回归模型:
𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2𝑥2 + 𝜀 (7)
由于遗漏变量问题,假设令 y 只对𝑥1回归,并通过 OLS 估计。通过简单的计量经济学知识可知,𝑥1的回归系数的偏差如下:
~ ~ ~
𝑏𝑖𝑎𝑠 (𝛽1) = 𝐸 (𝛽1) − 𝛽1 = 𝛽2 𝛿1 (8)
其中𝛽2是真实模型中
基于随机贴现模型的因子筛选法 来自淘豆网m.daumloan.com转载请标明出处.