股票型量化私募基金的评价及筛选体系初探

量化小白Literacy
10332021-08-21 22:42

股票型量化私募基金的评价及筛选体系初探

——基于多因子定量研究的思想

 

随着投资者对私募基金的关注多越来越高,不仅一般的专业机构投资者早已开展私募基金相关业务,包括FOF、产品代销等、私募管理人孵化等,越来越多的高净值个人客户以及上市公司也开展了对私募产品的投资。相比于公募基金的“公开透明”,私募基金管理机构众多,策略迥异,信息披露较为不透明等特点,给投资者进行基金选择带来了较多的困难。关于公募基金与私募基金的策略以及业绩表现的差异已有很多的研究给出了观点,本文不再详细分析。

一套行之有效的基金筛选体系是理论界和实务届研究人士一直致力于寻找的方向。一般而言目前主要的单个私募基金评价主要从主观分析和基金客观表现两个角度进行,评价的维度涵盖了基金管理人、策略研究、产品历史表现等多个角度。本研究团队在私募基金的投资过程中也形成了基于多个分析维度对私募基金的评价体系,对单个基金的评价已经较为翔实。

考虑这样一个情景,如今私募管理人越来越多,在组合中我们更倾向于在管理人的规模、成长期风格等多个维度进行分散配置,在众多的私募基金中如何进行高效的筛选呢?本文试图针对此问题试图寻找一个答案,即基于各类历史表现的指标,包括收益、风险、风险调整后收益、选股择时能力、策略的特质性等指标,能否从这些指标中提取有效的、稳定的、具有广泛适应性的指标并构建相应的评价体系帮助我们选出未来表现更好的私募基金?

下文为本团队研究成果的部分内容展示,供交流使用。

 

一、主要指标介绍

本文使用的指标主要包括各类风险收益指标,另外本文基于T-M模型和CAPM模型计算了管理人的选股择时能力,同时,我们基于Nicolas P.B. Bollen(2013)等的相关研究构建了基金的特质性风险。

 

二、数据的筛选及清洗

1、数据的筛选

本研究使用到的数据包括量化私募股票多头基金的累计净值以及市场基准数据,如中证500指数数据,数据分别来自朝阳永续基金研究平台和Tushare接口。

为了测试本文构建的指标体系的稳健性,本文筛选了两大类样本进行研究。第一大类样本为全部量化类私募股票多头基金的数据(数据库筛选标准为私募管理人+量化+股票多头+存续期1-5年+目前存续+已经备案),数据库中导出的符合条件的样本基金共2114只,后续研究中简称此样本为BIG样本。

第二类样本为全部指数增强类私募基金(在第一类的筛选基准上,筛选关键词包括300、500、1000、指数增强、指增等),数据库中导出的符合条件的样本基金共834只,后续研究简称此样本为指增样本。

2、数据的清洗
在对原始样本数据进行分析后,我们发现,数据中存在如下问题:
(1)太多的缺失值,产品缺失值的原因有如下几点,很多基金压根不披露净值,基金从运作至今未披露任何净值;
(2)有些基金存在净值的中断现象,如2018年1月开始运作,2019年才开始披露净值,且披露时净值远远大于1;
(3)有些基金在某个时间点之后至今的净值都未披露。
(4)部分基金为日净值,部分基金为周净值,更有甚者一段时间为周净值,一段时间为日净值。
(5)基金的存续期差异很大。
如上种种问题,使得对私募基金的大样本研究的困难程度远远超过公募基金。另外还有一个不容忽视的问题,有些基金没有披露净值,我们研究的是净值相对完整的基金,在样本的选择中不可避免地出现了幸存者偏差问题,但由于我们试图构建一种从数据库中筛选出表现相对优秀的基金的方法,即使存在幸存者偏差,但亦不会对我们后续的筛选结果有太多的影响。
接下来我们对原始样本数据进一步筛选,在我们的指标体系中,我们会基于多个指标的不同窗口期赋予不同的权重,因此对于基金的存续期有严格的要求。假设目前为2021年8月10日,我们窗口期和产品持有期的分界点为T日,比如2020年12月,我们要筛选2021年表现优秀的产品,利用窗口期内的数据即2020年12月前的数据进行分析,于是我们对于样本基金的净值需要设定以下几个条件:
(1)基金的净值至少更新到当前日期的3周前(考虑到有些基金周净值披露稍晚);
(2)基金的净值的开始日期必须早于2020年1月1日之前。
在如上进行筛选后,BIG样本实际可用样本为645只基金,指增类样本的实际可用数据为198只基金。

 

3、因子值的计算。
在完成样本的筛选后,我们计算了两个样本的全部因子值,为了更多地验证指标体系的稳健性,我们将每个样本又分为两个不同的窗口期和持有期进行测试,这样一共形成了4个子样本,如下表:
 

窗口期

持有期

样本基金数

代号

BIG样本

成立至2019年12月

2020年全年

406

样本1

成立至2020年12月

2021年1-8月

645

样本2

指增类样本

成立至2019年12月

2020年全年

88

样本3

成立至2020年12月

2021年1-8月

198

样本4

4、去极值、标准化

在计算完每个子样本的全部因子数据后,我们首先进行简单的描述性分析,我们以样本1和样本2中计算的全部因子的成立至今的卡玛比(变量名为:阶段卡玛_all)为例(分别为上图和下图):

股票型量化私募基金的评价及筛选体系初探

股票型量化私募基金的评价及筛选体系初探

箱形图显示两个数据中均存在大量的异常值,这将会给后期的相关性分析以及回归分析带来较多的强影响点,进而影响我们分析的结果。因此,需要对数据进行去极值处理。我们采用学术界和量化界常见的中位数去极值法。
中位数去极值法,又称MAD去极值处理法,将偏离中位数5倍去均值中位数的数据拉回。绝对中位差(MAD)较标准差而言对离群值(outlier)也就是异常值更加稳健。在标准差计算中,数据点到其均值的距离要求平方,因此对偏离较为严重的点偏离的影响得以加重,也就是说异常值严重影响着标准差的求解,因此使用中位数极值法能更好的度量和修正异常值。(默认N=5)
股票型量化私募基金的评价及筛选体系初探
去极值后的如上两个因子的箱形图如下,可见异常值问题已经得到了较好的解决。

股票型量化私募基金的评价及筛选体系初探

股票型量化私募基金的评价及筛选体系初探

5、数据标准化
在本文中,我们将会对于单调性较好的单因子进行因子组合,构建评价体系,由于不同因子的量纲不同,无法进行横向合并计算,为了方便因子组合,我们需要对全部数据进行标准化。我们采用常见的均值标准差标准化(Z-Score)方法,在某一时间截面,将因子序列变为以0为均值,1为标准差的序列。

计算公式如下:

股票型量化私募基金的评价及筛选体系初探

三、单因子分层测试

在单因子分层测试中,我们在窗口期内计算出各类因子指标,将全部基金根据某一个因子进行排序,等分为5组,按照因子值从大到小排序,在持有期,我们对每一组基金进行等权重配置,根据周净值及其涨跌幅拟合持有期每一组基金的组合净值走势,并计算相关的风险收益指标。

以样本1为例,我们以持有期基金的收益率指标为目标,检验全部基金的每个因子值与持有期全部基金的收益率的相关性,即类似多因子分析中IC系数的计算,此处我们使用斯皮尔曼秩相关系数作为RankIC的计算标准,筛选出RankIC系数的p值小于10%的因子,其实在此类研究中由于样本量有限,我们可以不要太在乎斯皮尔曼秩相关性检验的p值,可以从理论的角度结合相关性进行因子的筛选。本研究中由于私募基金的存续年限普遍较短,我们无法计算ICIR这一指标以反应IC的稳定性。

如下表为样本1中全部因子中与持有期全部基金收益率显著关的因子:

因子

相关系数

P值

因子

相关系数

P值

选股收益

0.251

0.000

阶段累计收益_year

0.239

0.000

alpha实力

0.186

0.000

阶段年化波动_year

0.145

0.005

阶段夏普_all

0.151

0.003

阶段下行_year

0.148

0.004

阶段卡玛_all

0.106

0.040

阶段索提诺_year

0.153

0.003

阶段累计收益_all

0.262

0.000

阶段夏普_half

0.178

0.001

阶段年化波动_all

0.093

0.073

阶段卡玛_half

0.155

0.003

阶段下行_all

0.088

0.089

阶段累计收益_half

0.255

0.000

阶段索提诺_all

0.146

0.005

阶段年化波动_half

0.206

0.000

阶段夏普_year

0.178

0.001

阶段下行_half

0.224

0.000

阶段卡玛_year

0.137

0.008

阶段索提诺_half

0.159

0.002

类似地,我们计算样本1中全部因子中与持有期全部基金夏普比显著相关的因子:

因子

相关系数

P值

因子

相关系数

P值

选股收益

0.254

0.000

阶段夏普_year

0.236

0.000

择时系数

-0.090

0.081

阶段卡玛_year

0.208

0.000

择时收益

-0.090

0.081

阶段累计收益_year

0.148

0.004

alpha实力

0.238

0.000

阶段年化波动_year

-0.102

0.048

阶段夏普_all

0.246

0.000

阶段下行_year

-0.095

0.066

阶段卡玛_all

0.208

0.000

阶段索提诺_year

0.203

0.000

阶段累计收益_all

0.285

0.000

阶段夏普_half

0.247

0.000

阶段年化波动_all

-0.130

0.012

阶段卡玛_half

0.248

0.000

阶段下行_all

-0.138

0.007

阶段累计收益_half

0.209

0.000

阶段索提诺_all

0.240

0.000

阶段索提诺_half

0.236

0.000

接下来本文不仅局限于上述因子,当然上述因子为重点因子,分别就单个因子与检验期的收益率相关性、散点图、分组净值、单调性情况进行测试。
如下为部分结果展示,限于篇幅此处仅展示部分因子。
近一年的年化波动率与持有期收益率的散点图(上图),以及成立至今的卡玛比与持有期收益率的散点图(下图):

股票型量化私募基金的评价及筛选体系初探

股票型量化私募基金的评价及筛选体系初探

下图为近一年的年化波动率因子的分层测试结果:

股票型量化私募基金的评价及筛选体系初探

下图为成立至今卡玛比因子的分层测试结果:

股票型量化私募基金的评价及筛选体系初探

下表为近一年的年化波动率指标分组净值表现:

年化波动_year

分组

累计收益

最大回撤

年化收益

年化波动

夏普比

卡玛比

group1

23.78%

3.74%

23.78%

8.90%

2.5

6.36

group2

35.47%

8.14%

35.47%

15.50%

2.19

4.36

group3

33.58%

7.44%

33.58%

16.03%

2

4.51

group4

35.35%

7.97%

35.35%

18.93%

1.79

4.43

group5

39.38%

10.23%

39.38%

21.49%

1.76

3.85

下表为成立至今的卡玛指标分组净值表现:

阶段卡玛

分组

累计收益

最大回撤

年化收益

年化波动

夏普比

卡玛比

group1

29.49%

8.46%

29.49%

16.90%

1.66

3.48

group2

33.46%

6.46%

33.46%

16.25%

1.97

5.18

group3

34.45%

7.58%

34.45%

16.40%

2.01

4.54

group4

36.21%

7.56%

36.21%

16.68%

2.08

4.79

group5

34.15%

5.91%

34.15%

14.22%

2.3

5.78

四、组合因子的构建思路及比较研究
在以上单因子测试环节,我们观察到因子测试结果可以分为三类:
1、单调性比较明显,第五组的收益率明显高于其他组别,且从第五组到第一组收益逐渐降低,第五组也可以获得相对较高的夏普比;
2、存在一定的单调性,但收益最好的组在第4组,第五组的收益反而小于第四组或者第三组;
3、不存在单调性,因子对于收益的区分不够明显。
我们进行了大量的测试,将同一因子在四类子样本中反复比较测试,最后我们提出如下几类因子合成方式,这几类合成因子在不同的子样本中具有较好的表现,且部分因子在四类样本中表现较为稳定和一致。
本文的因子基于标准化后的因子数据,我们测试了如下大类因子:
1、factorq_eq:收益类、风险类、风险调整收益类指标等权配置+择时因子;
2、factorq2_eq:收益类、风险类、风险调整收益类等权配置+择时因子、选股因子
3、factorw_eq:收益类、风险类、风险调整后收益2:3:3+择时因子
4、factorz_eq:收益类、风险类、风险调整后收益2:3:3+择时因子、选股因子
5、factorr_eq:收益类、风险类、风险调整后收益2:3:3+择时因子、特质性因子
6、factora_eq:收益类、风险类、风险调整后收益2:3:3+择时因子、选股因子+特质性因子
7、factorno_eq:与factora_eq一样的指标,但未考虑部分因子的反转特征,未做分位数转换。

从测评结果看factorr_eq因子在不同的样本中均具有均具有较好的单调性对于未来半年-至一年的基金收益具有良好的筛选能力

测评结果:

股票型量化私募基金的评价及筛选体系初探

股票型量化私募基金的评价及筛选体系初探

股票型量化私募基金的评价及筛选体系初探

五、组合因子基金评价结果

(1)样本1中factorr_eq分层测试结果(5组)
 

累计收益

最大回撤

年化收益

年化波动

夏普比

卡玛比

group1

27.55%

4.09%

27.55%

9.85%

2.65

6.74

group2

28.75%

6.84%

28.75%

15.15%

1.8

4.2

group3

32.11%

8.00%

32.11%

16.49%

1.86

4.02

group4

38.42%

8.85%

38.42%

17.84%

2.07

4.34

group5

40.80%

9.72%

40.80%

21.62%

1.82

4.2

股票型量化私募基金的评价及筛选体系初探

样本1中factorr_eq分层测试结果(10组)
 

累计收益

最大回撤

年化收益

年化波动

夏普比

卡玛比

group1

25.83%

4.11%

25.83%

8.64%

2.82

6.29

group2

29.21%

4.47%

29.21%

11.81%

2.35

6.54

group3

32.04%

7.49%

32.04%

15.62%

1.95

4.28

group4

25.40%

7.20%

25.40%

14.93%

1.6

3.53

group5

30.62%

7.96%

30.62%

17.10%

1.7

3.84

group6

33.61%

8.03%

33.61%

16.00%

2.01

4.19

group7

37.38%

8.82%

37.38%

17.94%

2

4.24

group8

39.40%

8.87%

39.40%

17.91%

2.12

4.44

group9

35.89%

9.58%

35.89%

21.29%

1.61

3.75

group10

45.71%

9.88%

45.71%

22.04%

2.01

4.63

股票型量化私募基金的评价及筛选体系初探

(2)样本2中factorr_eq分层测试结果(5组)
 

累计收益

最大回撤

年化收益

年化波动

夏普比

卡玛比

group1

4.05%

3.62%

6.89%

7.73%

0.7

1.9

group2

7.07%

5.53%

12.14%

10.21%

1.04

2.2

group3

9.21%

7.12%

15.92%

13.26%

1.09

2.24

group4

10.33%

8.04%

17.93%

14.77%

1.11

2.23

group5

18.99%

8.11%

33.87%

16.56%

1.95

4.17

股票型量化私募基金的评价及筛选体系初探

样本2中factorr_eq分层测试结果(10组)
 

累计收益

最大回撤

年化收益

年化波动

夏普比

卡玛比

group1

2.82%

3.11%

4.78%

6.36%

0.52

1.54

group2

5.28%

5.18%

9.02%

9.46%

0.79

1.74

group3

5.65%

4.32%

9.66%

8.97%

0.91

2.24

group4

8.47%

6.73%

14.62%

11.73%

1.12

2.17

group5

9.27%

6.21%

16.03%

13.29%

1.09

2.58

group6

9.13%

8.08%

15.78%

13.48%

1.06

1.95

group7

9.74%

7.77%

16.88%

14.29%

1.08

2.17

group8

10.91%

8.31%

18.97%

15.36%

1.14

2.28

group9

17.96%

7.45%

31.93%

15.73%

1.93

4.29

group10

20.00%

8.77%

35.77%

17.45%

1.96

4.08

股票型量化私募基金的评价及筛选体系初探

(3)样本3中factorr_eq分层测试结果
 

累计收益

最大回撤

年化收益

年化波动

夏普比

卡玛比

group1

18.76%

4.44%

18.76%

8.99%

1.92

4.23

group2

25.20%

7.58%

25.20%

18.04%

1.31

3.32

group3

37.67%

9.23%

37.67%

20.01%

1.81

4.08

group4

37.74%

9.39%

37.74%

21.48%

1.69

4.02

group5

39.90%

10.46%

39.90%

23.28%

1.65

3.81

股票型量化私募基金的评价及筛选体系初探

(4)样本4中factorr_eq分层测试结果(5组)

 

 

累计收益

最大回撤

年化收益

年化波动

夏普比

卡玛比

group1

6.92%

3.40%

11.88%

7.39%

1.41

3.49

group2

8.98%

7.22%

15.52%

13.42%

1.04

2.15

group3

11.12%

7.96%

19.36%

15.97%

1.12

2.43

group4

12.59%

6.50%

22.02%

14.12%

1.45

3.39

group5

21.31%

5.66%

38.27%

15.36%

2.39

6.76

股票型量化私募基金的评价及筛选体系初探

六、后续方向

根据factorr_eq因子,我们基于成立日至2020年12月末的窗口期对全部量化类股票多头私募基金进行了排序,得出最新一期的基金排名。后期,我们也将继续该项研究,针对研究方法、因子组合等重点进行拓展,并于季度末对朝阳永续数据库中全部可以获得的量化多头类私募基金进行排序,并持续跟踪业绩表现。
当然,具体到基金的选择,还需根据排序结果结合对于管理人和基金的其他特征综合选择,但本研究给出了一种思路,即如何在众多的私募基金中快速有效地进行选择,选出未来净值表现会有更高的概率胜出的一些基金。

 

 

免责声明:
您在阅读本内容或附件时,即表明您已事先接受以下“免责声明”之所载条款:
1、本文内容源于作者对于所获取数据的研究分析,本网站对这些信息的准确性和完整性不作任何保证,对由于该等问题产生的一切责任,本网站概不承担;阅读与私募基金相关内容前,请确认您符合私募基金合格投资者条件。
2、文件中所提供的信息尽可能保证可靠、准确和完整,但并不保证报告所述信息的准确性和完整性;亦不能作为投资决策的依据,不能作为道义的、责任的和法律的依据或者凭证。
3、对于本文以及文件中所提供信息所导致的任何直接的或者间接的投资盈亏后果不承担任何责任;本文以及文件发送对象仅限持有相关产品的客户使用,未经授权,请勿对该材料复制或传播。侵删!
4、所有阅读并从本文相关链接中下载文件的行为,均视为当事人无异议接受上述免责条款,并主动放弃所有与本文和文件中所有相关人员的一切追诉权。

0
好投汇
第一时间获取行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「好投汇」,或用手机扫描左方二维码,即可获得好投汇每日精华内容推送和最优搜索体验,并参与编辑活动。

推荐阅读

0
0

评论

你来谈谈?
发表

联系我们

邮箱 :help@haotouxt.com
电话 :0592-5588692
地址 :福建省厦门市湖里区航空商务广场7号楼10F
好投汇微信订阅号
扫一扫
关注好投汇微信订阅号
Copyright © 2017-2025, All Rights Reserved 闽ICP备19018471号-6