“迎财富之新貌,搏时代之浪潮”,由私募排排网主办,万和证券、银河期货联合主办,民生期货、东证期货、长城证券(002939)协办,和讯网为特邀媒体,证券之星为媒体支持单位的“第十届对冲基金年会”,于2023年12月14-15日在北京金融街(000402)丽思卡尔顿酒店举行。
在12月15日的会议上,玄元投资副总经理、量化投资总监孔镇宁出席并进行了主题为《正心、取势、明道、优术、合众、践行——玄元量化投资回顾与展望》的报告。
玄元投资副总经理、量化投资总监孔镇宁先生是清华大学学士(特等奖学金,优秀毕业生)、美国耶鲁大学博士。特许金融分析师(CFA),金融风险管理师(FRM)。具有13年全球市场量化投资经验,曾在美国担任投资经理,期间累计管理规模超过30亿美元。2014年从华尔街回国加入广发证券(000776),任自营部量化投资总监。2021年加盟玄元投资。
玄元投资副总经理、量化投资总监 孔镇宁
以下为演讲全文
今天非常高兴在这里跟大家做一个交流分享。刚刚马总分享了很多观点和想法,我也是非常赞同的,所以在接下来的很多分享也会有一定的呼应。
我今天分享的题目是“正心、取势、明道、优术、合众、践行”,这是老子《道德经》中的哲学思想,用以指导修身与立事。我认为它用在投资领域也是特别合适的,而且很多层面与量化投资的思想是非常契合的。玄元投资过去多年的发展,某种意义上也正是在践行着这样的理念与方式。
玄元投资是2015年7月在广州成立,目前注册在广东珠海。玄元是国内为数不太多的同时拥有量化和主观投资团队的私募管理人。在过去几年,无论是主观还是量化,都取得了不错的成绩。虽然在策略与产品层面,量化与主观完全独立运作,但是在公司内部,无论是在行业基本面研究层面,还是在市场交易行为模式探索层面,量化与主观的相互借鉴、相互融合,形成了非常好的相互促进的内生动力,使得两个方向都不断地进步发展。

我本人在玄元负责量化投资,本科毕业于清华大学,博士毕业于美国耶鲁大学,在美国工作6年后,回国加入了广发证券,后面加入玄元。
我们始终认为,对于量化投资,即不用神话也不用妖魔化。量化投资是一种方法论,是一种投资的手段,是研究的方式。它解决的问题是人脑或者通过人为的方式去判断或者决策而存在的缺陷和问题。量化投资通过更客观的规律、系统化、科学化的方式去解决。

玄元量化投资团队过去多年进化的过程,某种意义上也是整个国内量化多年发展的一个缩影。从早期到现在,在这个进化的浪潮中,国内非常多的量化管理人通过自己的不断迭代与优化,茁壮成长,同时慢慢积累、沉淀、凝聚,形成自己的优势,也形成自己的特色与风格。

玄元最大的特色和风格,就是一直以来坚持的把基本面和价量有机地融合在一起,注重寻求稳定而多元的超额收益来源。我们在这方面做出了比较多的深入工作和研究,有着很好的积累。同时,我们在策略与产品管理层面,比较注重风险控制,追求风险调整之后的收益最优化。
初期的量化投资,是以传统的多因子模型为基础的。多因子模型,很多是从一些经典的资产定价模型以及行业分类和财务指标去寻找一些有效的定价因子。这些根据财务报表构建的因子也是我们经常说的基本面因子。
基本面因子,解决的是如何判定一个公司中长期的价值。而一个公司股票在交易过程中的价格会围绕这个价值波动,但不意味着时时刻刻是符合这个价值的。很多时候是由于市场情绪,是由于市场参与者的交易行为决定的。所以,短期的价格直接影响因素,更多的是价量层面的因素。

价量因子以及围绕价量因子构建的统计套利模型与策略,就是去刻画、捕捉这种短期行为导致价格偏差的有效手段。这里,我们会看到,基本面类因子和价量因子刻画和捕捉的是市场上不同层面,不同周期的定价趋势或者是市场定价的不有效性。本身获取的超额收益来源也是低相关甚至是不相关的。如果能够有效将它们融合在一起,就可以起到收益平滑稳定的效果。
传统的基于财务数据、财务报表构建的基本面因子,因为当前信息传递的迅速发达,以及整个市场有效性的不断增加,它的有效性也在减弱。但是,当我们借鉴融合主观行业研究员甚至个股的研究方式,去了解他们如何分析更细分的行业以及股票的时候,我们会有非常多的启发。那就是如何找到一些更高频、更及时甚至更另类的数据,能够帮助我们,提前于市场做出一些对公司基本面的判定。这个应运而生的就是这些年一直在不断演进的,非常广大的一类信息源,就是另类数据。

我们习惯上把这些数据和信息源叫做广义基本面。包括分析师预期数据,包含了各种财政新闻预警,还有各个细分行业甚至是跨行业的各种数据,比如说产业链的数据,供应链的数据,销售的数据,产品价格的数据,原材料价格数据、库存数据等等。这些广义基本面数据对传统财务报表的数据是一个极大的补充,甚至在计算我们熟知的基本面指标的时候,用这些更高频或者是更及时的数据作为补充,会看到效果上有很好的提升。
随着数据的不断增加,尤其是这几年在交易层面高频数据的广泛应用,在处理和研究这样大量的数据的时候,人脑或者人力的非常多的缺陷就体现出来了:

首先第一个是我们人脑的算力非常不足。有句话说“人类焦虑的本源来自自己想得多算的少”。我们人脑在经过千百万年的进化后,又非常强大的能力,但是要处理我们现在经常面对的海量数据(603138),却依然是力不从心的。尤其是从大量的非结构化数据中寻找定量的规律的时候。这些非结构化的数据,既可以指情感数据、文本数据,也可以指图的关系,比如说产业链的图谱,供应链的图谱,还有交易的相关性图谱等等,这么多图谱放在一起,用传统的研究方式,基于人脑的计算,很难从中找出深层次的规律。这个时候机器与人工智能的算法就有非常强的用武之地。
人脑的第二个缺陷就是非常喜欢做线性的归纳与外推。我们喜欢用线性回归的方式去寻找因果关系,对未来做预测的时候也最擅长做线性的外推。但是今天的市场,股票数量众多,多样的特征,海量的数据叠加起来之后,在非常多的层面看到的现象都是非线性的。这既体现了市场的有效性在不断增加,也体现了本身客观的世界、投资的世界充满了多样性、高维的复杂度与不确定性,不能简单地以一个一维、两维的线性模型做充分的解释。这个时候也是人工智能算法处理非线性关系所擅长的方向。
第三是人面对非常多的快速的变化,反应是不足的。

事实上,机器学习非常多算法的提出,其实在上世纪50、60年代,但是当时为什么没有得到很好的发展?是局限于软硬件的算力。
进入了新的世纪以后,随着软硬件算力的大幅提升,使得之前很多的没办法做实验,没办法落地的算法都得到了应用。而这种应用又在不断地反馈,促进算法的提升,这样形成了非常好的反馈循环,从而也使得非常多的机器学习的工具、算法,在很多的领域获得了巨大的成功。比如说最经典的是图象识别和语音识别。这些年,更有几个标志性的事件——前几年基于深度学习模型地AlphaGO在围棋领域战胜了人类,还有今年的大模型ChatGPT——这都给我们非常大的启示,在解决这些非常复杂的问题的时候,我们人脑的能力很有限,而机器确实有独特的、绝对的优势。
所以,这些年,机器学习与人工智能算法的在金融与投资,尤其是量化投资领域得到了广泛的应用,并取得了巨大的成功。
但是,无论是在基本面领域,还是在价量领域,我们在应用机器学习的过程中,并不会盲目地套用,甚至是简单地调包。这是因为在投资这个领域,其实有非常多的特性,在面对这些特性的时候,通用的人工智能机器学习的算法也会有它的缺陷。这个时候需要把人的先验知识和机器的优势互补,我们称之为人与计算机的平衡和互补。
那么AI的缺陷有什么
第一,为什么我们说是机器学习,因为现在的人工智能某种意义上,还是一个学习的模型,学习的工具,它还没有办法真正产生推理,抽象能力和创造能力。举个例子,比如说ChatGPT非常强大,但也是基于所有能从互联网里面收集出来的数据学习出来的知识,但是要它做一个最简单的数学推理的题,比如说拿一道初中的平面几何题来做,它做不出来,因为它没有这个能力——当然未来可能还是存在的——所以我们会看到机器学习最成功的领域,图象识别,语音识别,因为有大量的样本,而且是静态的,也不需要太多的基于这个东西的延伸、推理与创造。但是投资和这些领域是不太一样的。机器学习擅长的是有一个模型之后,去寻找最优的参数、范式,实现从1到10到100的指数级的能力的增长,但是它缺乏的却是从0到1,缺乏的是面对一个现象时候,去理解问题的本质,并进行抽象,以及最终形成解决这个问题的方案。就比如,现在其实机器学习的算法,都是我们人类在面对不同的问题的时候,根据问题的特征去具体涉及的框架模型。

第二,机器学习强在框定的模型内、框架内去达到最优的绩效,但是一旦跳出这个框架就可能会出问题。比如说左边这张图是在美国智能驾驶的公路测试中一段非常著名的录像,显示的是这辆车在路上行使,突然前面一辆警车,没有任何预示情况下闪起了灯,这辆车就加速向它冲过去了。因为它的自动驾驶算法没有把这种场景设定进去进行过训练,当它遇到这种场景时,自动驾驶就不知道该怎么做了,就失控了。第二个图是一个围棋图谱。我们知道AlphaGO已经是人类不可战胜的了,但是美国有一个实验室非常有意思,他们想既然AlphaGO是针对人类的棋谱训练出来的,那就他们就用AlphaGO的棋谱来训练一个新的模型,看能不能打败AlphaGO。最后,这个新的针对AlphaGO训练的模型确实战胜了AlphaGO,但这个AI和人下棋又下不过了。所以说人工智能目前只是一套框架内选优的结果,当我们把它用在投资的领域的时候,场景时更加负责的。投资领域是充满了各种变化,这个时候没有人的干预和处理,我们不想让它失控,也不想让它加速撞到警车。
AI还有非常多的前提假设得满足:
比如说需要样本足够大。可是当我们尤在做某一个细分行业的研究过程中,过去这么多年十几年的基本面数据样本都不足以训练一个模型,这个时候怎么办?这个时候就要借鉴融合主观研究的知识积累与先验知识,再通过机器和回测去严格的测试与验证。
此外,AI很多成功的场景需要性噪比是比较高的,但是投资领域的性噪比是比较低的。同时,无论是语音识别还是图像识别,相对是静态的。换句话说我用什么算法和别人用什么算法,以及多少人在对这个图像和语音做识别是互不干扰的。但是投资不是,我们用了什么算法,我们找到了什么规律,当我们参与市场的时候,本身就会改变这个规律,同时其他人的参与,其他人使用的算法,都会不断地改变这个市场地运行。所以投资市场是非常动态的,而不是静态的特征。
还有就是AI应用在投资中特别容易过拟合。传统的机器学习的方式都没有问题的时候,很可能在金融领域会有些问题。
所以我们需要技术调优,我们也叫做精细化模型——人与机的平衡与互补。

无论是传统方式,线性的方式还是机器学习的方式,我们做的事情是很简单的,给定一个X——这个输入可以是因子,可以是特征,甚至最原始的数据,然后我们去构建F——一个模型或者是一个函数,我们想预测的是Y——这个Y可能是未来一个小时的收益,一天的收益,一个月的收益,也可以是未来一小时的排序,也可以是一天的排序。这个问题的形式非常简单,但是里面的内涵或者是变化可以是非常非常多的。
在处理这样的问题的时候,每个层面到底该怎么处理数据,怎么设计这个模型,甚至如何调增预测目标——就是说怎么把这个问题的各个层面精细化的去处理,使得最终能够达到真正我希望达到的预期,这里面的细节与文章是非常多的,而不是简单的拿现成的程序包调一下,这种方式我们是不太喜欢的,既是对算力的巨大浪费,本身也没有能够使我们对这个模型、对这个问题有更深刻的认知,所以我们始终强调和坚持的都是会采用这种更精细化的方式去把人机结合起来。
所有的这些预测,最终会落到一个最终的策略或者产品的表现上。通常,这个是通过优化的方式转化的。这个时候,就涉及到一个风险与收益的对应优化关系。所以,当我们在评判一个管理人的产品,内部在测试一些策略、方法论做的因子组合的时候,很少会单独设定一组参数之后跑出来一个业绩做一个比较。我们会尽量把一条有效前沿完整的跑出来。

有效前沿是投资领域一个非常有意义和有效的概念。它所展示的是风险和收益对应的关系。例如,左边的图的横轴是超额的年化波动率,纵轴是年化的超额收益;右边的图的横轴是十年间的超额最大回撤,纵轴是年化的超额收益。在这些图上,在比较不同策略的时候,我们很少在某个截面上去评判某一个点和另外一个点谁好谁坏,而是对于不同的策略,对于不同的方法论,对于不同的因子组合或者优化方式,把整条曲线跑出来之后,我们就会有比较明显的结论,不同策略的特性以及最优的选择也会更加清晰。
这条曲线意味着什么?就是在不同的风险设定的情况下,能获得的最大收益。在投资里面,尤其是对于量化投资,都是收益和风险兑换的关系。对于我们来说,我们也更倾向于把风险控制在合理的情况下,去获取更合理的优化后的收益。

每年底的时候,我们经常会对过去一年做总结,对未来作展望。上面这个图里的4行文字,其实是我在去年年底,在公司做2023年策略会的时候写的,但是最近拿出来一看,发现和我们今天对明年的想法是一致的。我们觉得市场整体明年比今年还是会好的——我们都知道今年是比2022年好的——量化环境还会继续有所改善,但是竞争一定会更加激烈,有效性也会增加,这是好事,是压力,当然更是动力与驱动力。相对指数的超额收益,尤其是严格对标基准行业和风格控制,换句话说,不带风格分离,超额会越来越难做。面对挑战,无论是市场、量化行业,还是我们自己,大家都会通过更深入的投研不断的迭代优化,与自我进化,面对挑战与变化。
上面这张图,是我们自己做的,用了全A等权的指数,从05年到今年12月4日的数据。每一个蓝色的点代表了一个交易日,横轴代表了当时PB的估值,纵轴代表站在那个交易日看未来的一年收益。这个图是评估站在那个时点,从PB的角度、从估值的角度来说,它的性价比是不是便宜、是不是贵。最左侧蓝色的线是2018年年底,是1.41,那时候几乎是A股,至少从05年到现在,最低的点;去年是橙色的线,1.59;2021年是绿色的线;今年的位置是红色的线。可能没办法保证明年一定是上涨的,但是从性价比或者是历史的概率来说,倒是没有多大的必要过分的悲观的。
未来虽然是充满挑战的,但是也充满了希望和机遇。这两天北京在下大雪,雪代表着祥瑞——瑞雪兆丰年,希望这是好的预兆!我们祝愿2024年大家收获满满,谢谢大家!
最新评论