基研CheatSheet · 如何利用机器学习进行产品聚类(附代码)

嘟嘟的投研CheatSheet
3302023-10-08 14:51
好投课代表敲重点啦!!!本文介绍了如何使用高斯混合模型(GMM)来寻找投资产品,特别是在股权领域。GMM是一种广泛使用的聚类算法,可以根据产品的涨跌幅序列将它们分成不同的组。通过这种方法,投资研究人员可以更主动地筛选和寻找适合他们需求的产品,提高投资效率。该方法不仅适用于股权基金,还可以用于其他类型的资产类别。

作者:嘟嘟的投研CheatSheet,好投学堂专栏作家

题图:嘟嘟的投研CheatSheet微信公众号

图片


此前在《基研CheatSheet · 主观多头怎么选》中曾分享过主观权益的三类风格,而在前几天的文章《基研CheatSheet · 如何对产品进行业绩归因》中也展开讨论了产品的业绩归因,今天我们来个王炸:

如何在成千上万个产品中找到我们想要的产品?

除了用肉眼看跟利用相关系数进行分析以外,还可以用到机器学习,我们今天的主角是高斯混合模型Gaussian Mixture Model

GMM是广泛使用的一种聚类算法,具体原理感兴趣的朋友请自行搜索,展开太多怕击退大家的学习热情。只需知道,我们输入模型的是产品的涨跌幅序列,同时对components(我们想要的聚类数目)进行设定,剩下的就由算法自行处理,最后得到的便是聚类结果。

比如当我们把全市场几千个公募权益产品输入到GMM中,同时设定components = 5,稍等片刻就得到了如下聚类结果:

图表 聚类结果展示

Image

从聚类产品具体持仓来看,价值类策略被聚类到了分类0,新能源则被聚类至分类1,医药被聚类至分类2,偏均衡型策略被聚类至分类3,而核心资产则被聚类至分类4。从该角度看,此前我们将主动权益产品划分为质量(核心资产)、价值、成长三大风格,大体上跟模型的学习思路是一致的。

图表 每类只展示夏普最大的5个产品

Image

而当我们进一步调大components的值时,聚类的分类将更加细致,这时候我们可以用来发现一些之前没有留意到的风格,比如当components = 20时,微盘股产品不就自动出来了嘛。

图表 利用聚类快速寻找同类型产品

Image

上述思路不仅可以用在权益基金内部,还可以用在纯债、固收+、甚至各种私募策略上。如此一来,我们做多资产投研的工作,将可以从被动了解产品,转变成主动筛选并寻找产品。

另外,为了方便我们知道某个已知的产品归在某类时,特意写了一个查询函数,输入产品代码后将返回同组产品并按夏普降序排列。

Image

Image

最后,感谢Jon跟唐飞的灵感。


版权声明:文章版权归原作者所有,部分文章由作者授权本平台发布,若有其他不妥之处的可与小编联系。

免责声明:
您在阅读本内容或附件时,即表明您已事先接受以下“免责声明”之所载条款:
1、本文内容源于作者对于所获取数据的研究分析,本网站对这些信息的准确性和完整性不作任何保证,对由于该等问题产生的一切责任,本网站概不承担;阅读与私募基金相关内容前,请确认您符合私募基金合格投资者条件。
2、文件中所提供的信息尽可能保证可靠、准确和完整,但并不保证报告所述信息的准确性和完整性;亦不能作为投资决策的依据,不能作为道义的、责任的和法律的依据或者凭证。
3、对于本文以及文件中所提供信息所导致的任何直接的或者间接的投资盈亏后果不承担任何责任;本文以及文件发送对象仅限持有相关产品的客户使用,未经授权,请勿对该材料复制或传播。侵删!
4、所有阅读并从本文相关链接中下载文件的行为,均视为当事人无异议接受上述免责条款,并主动放弃所有与本文和文件中所有相关人员的一切追诉权。

0
好投汇
第一时间获取行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「好投汇」,或用手机扫描左方二维码,即可获得好投汇每日精华内容推送和最优搜索体验,并参与编辑活动。

推荐阅读

0
0

评论

你来谈谈?
发表

联系我们

邮箱 :help@haotouxt.com
电话 :0592-5588692
地址 :福建省厦门市湖里区航空商务广场7号楼10F
好投汇微信订阅号
扫一扫
关注好投汇微信订阅号
Copyright © 2017-2025, All Rights Reserved 闽ICP备19018471号-6