作者:嘟嘟的投研CheatSheet,好投学堂专栏作家
题图:嘟嘟的投研CheatSheet微信公众号
此前在《基研CheatSheet · 主观多头怎么选》中曾分享过主观权益的三类风格,而在前几天的文章《基研CheatSheet · 如何对产品进行业绩归因》中也展开讨论了产品的业绩归因,今天我们来个王炸:
如何在成千上万个产品中找到我们想要的产品?
除了用肉眼看跟利用相关系数进行分析以外,还可以用到机器学习,我们今天的主角是高斯混合模型:Gaussian Mixture Model。
GMM是广泛使用的一种聚类算法,具体原理感兴趣的朋友请自行搜索,展开太多怕击退大家的学习热情。只需知道,我们输入模型的是产品的涨跌幅序列,同时对components(我们想要的聚类数目)进行设定,剩下的就由算法自行处理,最后得到的便是聚类结果。
比如当我们把全市场几千个公募权益产品输入到GMM中,同时设定components = 5,稍等片刻就得到了如下聚类结果:
图表 聚类结果展示
从聚类产品具体持仓来看,价值类策略被聚类到了分类0,新能源则被聚类至分类1,医药被聚类至分类2,偏均衡型策略被聚类至分类3,而核心资产则被聚类至分类4。从该角度看,此前我们将主动权益产品划分为质量(核心资产)、价值、成长三大风格,大体上跟模型的学习思路是一致的。
图表 每类只展示夏普最大的5个产品
而当我们进一步调大components的值时,聚类的分类将更加细致,这时候我们可以用来发现一些之前没有留意到的风格,比如当components = 20时,微盘股产品不就自动出来了嘛。
图表 利用聚类快速寻找同类型产品
上述思路不仅可以用在权益基金内部,还可以用在纯债、固收+、甚至各种私募策略上。如此一来,我们做多资产投研的工作,将可以从被动了解产品,转变成主动筛选并寻找产品。
另外,为了方便我们知道某个已知的产品归在某类时,特意写了一个查询函数,输入产品代码后将返回同组产品并按夏普降序排列。
最后,感谢Jon跟唐飞的灵感。
版权声明:文章版权归原作者所有,部分文章由作者授权本平台发布,若有其他不妥之处的可与小编联系。