我已授权

注册

幻方量化陆政哲:量化投资大有可为 未来向头部聚集

2019-03-24 17:20:26 新浪网 

  新浪财经讯 “第十三届中国(深圳)私募基金高峰论坛”于3月21日-23日在深圳举行。

  幻方量化研究所负责人陆政哲以《新技术背景下的量化投资》为题发表了主题演讲。

首先,陆政哲介绍到了当前量化投资在国内外的情况。他说,量化投资是长期做一些大概率的事情,量化的核心是在有非常好的风险收益比例以后,长期维度上达到非常好的复利增长。

  首先,陆政哲介绍到了当前量化投资在国内外的情况。他说,量化投资是长期做一些大概率的事情,量化的核心是在有非常好的风险收益比例以后,长期维度上达到非常好的复利增长。

  目前,在全球金融市场体系里面,量化已经逐渐成长为最主要的组成部分;国内量化交易量的占比已经占到整个私募体系的30%,而且这个量还在不停地上升。

  未来趋势上,陆政哲认为在未来一方面是量化基金在整体国内资产管理领域的占比会持续上升,另一方面,管理规模会逐步向头部聚集。

  此外,他介绍到,主流的量化策略有几种,一种是市场中性策略,第二个是指数增强,第三种是更开放的,更多元的量化选股。

  他介绍了一些策略细节上的尝试,包括几个方面,一个是技术面的选股,基于量价指标的多因子模型的选股,还有基本面的选股,也是一些基本面因子的加入,以及一些另类数据的应用,同时有长周期和短周期的择时,加上最终的执行优化等。

  陆政哲认为,量化投资不会完全取代主观的投资,但是其必然在未来的发展趋势上能够赶上主观投资的步伐。在未来的中国市场里面,量化投资大有可为。

  以下为具体内容:

  陆政哲:非常荣幸今天能够到这样一个场合来跟大家做一个学习交流。先解释一下,因为刚才提到了我们公司的一个收益率很高的产品,三年有100%多的收益,但是它并不代表我们公司的产品全部有这样的收益,因为不同的产品根据它的策略类型的不同,在市场环境下它最终产生的绝对的收益是有差异的,所以我们整体上来说,作为一家量化机构,我们有非常丰富的产品线,可以说每个产品整体的收益状况都是非常稳定的,整个情况应该说还可以,但是不能说单个产品都这么厉害,如果说对我们定义为这个市场里的冠军,我们是非常惶恐的。

  施老师是我们非常尊敬的,在市场里非常著名的资深投资人,刚才听了施老师的演讲,总结他的投资逻辑,就是长期的做简单而正确的事,然后正确地做这样一个长期的事情,这是在我们看来无论是价值投资,还是对量化投资本身而言,一个非常核心的东西。刚才听了施老师演讲,我想到最近的一些情况,因为最近市场很热,所以身边不断地会有投资人或者朋友来问我,对现在这个宏观的市场你怎么看,是一个牛市的前兆还是一个反弹?或者说最近有没有可以推荐的个股,未来有很大增长潜力的股票。对这些投资人朋友而言,我往往会给一个回答,我说非常抱歉,这个我们都看不了,因为在我们看来,这个宏观市场的Beta以及一些个股的深度的Alpha其实是这个市场里面最难去把握和选择的一个东西。因为我们都知道,宏观的市场或者整个股票市场是一个不停流变的体系,对我们而言,我们觉得真正能够把握到这个市场的宏观的Beta和深度Alpha的人,应该是在这个市场里凤毛麟角的,像施老师这样有长期的投资经验的人,他才能够去把握这些东西。对量化机构而言,我们要把握的是一些一般性的规则,对我们而言,我们要去了解这个市场里面的一些社会学和经济学的基础的逻辑,有哪些因子或者哪些重要的因素可以影响一些股价变动,或者让我们去了解这个市场里面的具体的交易构成,具体的投资人是一个怎么样的行为逻辑。基于这样一个行为逻辑,我们去做一些大概率正确的事情。所以相对于基本面的投资而言,我们量化投资是长期做一些大概率的事情,然后在这个大概率的框架下达到一个非常好的风险收益的比例。有一个非常好的风险收益的比例以后,在一个长期维度上达到一个非常好的复利增长,这是量化的核心。

  我今天要讲的题目是“新技术背景下的量化投资”,我们经常对外用这样一个定义,我们都知道在现在的这个时代,或者这个历史的横截面上,非常多新技术的应用已经非常充分了。资本市场的投资跟10年前甚至20年前已经有了截然不同的一些变化,在今天我们可以在非常短的时间内就拿到全市场海量的信息,我们可以通过计算机的处理能力在非常短的时间内,就可以去做出一些决策,或者做出一些分析,这是我今天要讲的一个内容。

  这是国外一个非常著名的专门研究对冲基金的机构做的2018年全球资产管理规模最大的前10家机构,它有一个什么现象呢?本年度排名前4位以及前6位当中的5位,都是依靠计算机技术来开展投资决策的对冲基金。前10名里面,第一名是桥水,第二是AQR,第三是Renaissance Technologies,第四是Two sigma,它们在全球都占据了很大的市场份额,全球超过70%的成交量都是用计算机或者程序化的方式来进行,有超过50%的比重是由量化或者程序化的管理人,或者是接近量化投资的管理人来做出的。所以我们看到在全球的这样一个金融市场体系里面,量化已经逐渐成长成最为主要的组成部分。

  再回到国内看量化在中国市场的发展。我看了中信证券(600030)在年初对量化的研究报告,我这里的数据也是引用他们的研究报告,目前在国内市场里面,量化投资占到的整体的量或者管理资产的规模大概是3500亿到4000亿上下,当中有1200亿左右的公募基金,另外比较主要的一只是私募基金。我们在私募基金的体系内,大概有2000亿不到的量。大家知道国内私募基金的量在2.5万亿,当然去年下跌以后可能稍微减少了一些,但是整体量在2.2到2.5万亿之间。所以我们如果来看量化的部分在整体的私募基金的体量中占到的比重,大家可以看到,基本上管理的规模在8个百分点,8%是由量化基金来管理的,产品的数量占到10%。去年是有几百个这样的量化的量化私募的产品。交易量的占比已经占到整个私募体系的30%,而且这个量还在不停地上升,这是目前国内整个量化的情况。

  右边这个图是管理人的规模和管理人数量的统计,按照这个统计,到2018年为止,国内超过20个亿以上的头部的量化管理人,我们这边有24家,10亿到24亿的有30家,1亿到10亿的有110家。所以大家看到整个市场还是属于一个肥尾的分布,头部的效应还不是特别重。但在我们看来,我们觉得在未来有一个很大的趋势,一方面是量化的基金在整体的国内资产管理的领域里面占到的比重会有一个持续的上升,另外一方面,这个管理规模会逐步向头部做一个聚集,这是在我们看来一个比较大的趋势。

  主流的量化策略有几种,一种是市场中性策略,就是纯做Alpha的策略,第二个是指数增强,这在公募里面用得比较多,你不仅要拿Alpha,还要拿市场Beta的价值。第三种是更开放的,更多元的量化选股,既要拿一个Alpha,也要拿一个聪明的Beta,就是在选股的时候,他会做一些指数的择时,或者做一些风格因子的暴露,从而拿到更好的Beta收益。后面还有量化套利、CTA,这更多的是商品端的策略,以及FOF这样一个多策略的构成。目前市场上主流的策略基本上就是这些。

  今天我会介绍一下我们在每个策略细节上的一些尝试。对我们而言,我们对自己的定义是这样的:我们是借助统计学、数学的方法,利用计算机的技术非常高效、准确地处理市场当中的行情、数据,以及一系列的交易决策,我们在产品端的期望和把握是希望能够多市场、多策略、多品种、多周期的最大化投资的风险收益比。这是我们投资的理念。所以我们在每一个单一的策略上,我们试图通过各种各样的方式,通过非常基础的方式去做到一个相应比较极致的收益,然后把大家叠加在一块,最终构成一个比较好的收益曲线。所以主持人一开始提到的我们那个永途的产品,它事实上也是一个多策略叠加的结果。

  (见PPT)这是我们的收益分解细则,我们跟基本面投资不大一样,我们不会探索宏观的或者微观的股票本身的因素是怎么样,我们更多的关注在哪些细节项上,我可以把这个收益拿到,我可以拿到比市场一般投资人更好的超额的收益,其实归根结底就包括几个方面,一个是技术面的选股,这是我们基于量价指标的多因子模型的选股,还有基本面的选股,也是一些基本面因子的加入,以及一些另类数据的应用,同时有长周期和短周期的择时,加上最终的执行优化,我在后面都会具体提到。

  首先我们回到A股市场,为什么讲A股市场呢?至少在今天而言,我们仍然不能把它定义成一个有效的市场,或者说它是一个非常无效的市场。为什么这样讲呢?我下面放了一张图,这个图是从2015年股市大的波动开始到目前为止整个市场的成交额的变化。在这里面大家能够发现一个什么事情呢?从去年年末到今年年初,A股的成交量已经萎缩到一个非常低的水平,基本上日成交额在2000亿这样一个级别上。但是在2019年开始,特别是春节以后,这个成交量大幅上升,一下子达到了1万亿的规模。这种成交额的跨越式的变化,或者突然的变化,事实上是我们在任何一个成熟的市场很难看到的现象,除非是一些金融危机这种大的波动的情况下,但是正常的在一个成熟市场很难看到这样的情况。我们的交易波动在A股市场是非常情绪化或者是非理性的行为。我们从这个图可以看到年初开始有一系列的股票有很大的变化,比如说东方通信(600776)、人保、中信建投,还有复旦复华(600624)这样的股票。如果按照价值投资或者基本面的投资,这些情况是不可理喻的,为什么可以在短期内翻2倍、3倍甚至10倍,每天都是一字涨停,它恰恰反映了A股市场是一个以散户类型的投资行为占主导的市场动态结构。在这个结构里面,长周期而言,股价肯定是围绕公司的价值上下波动的,但是在短周期里面往往会出现极大的偏离。对我们这些量化机构而言,我们交易的不是公司本身,我们赚的是交易的钱,我们交易的是市场波动。所以如果说传统的Alpha体系更加重视因子背后的基础的价值投资的逻辑,它是一个长期有效的事情,而对我们而言,量化选股或者是量价这样一个体系的选股,它更注重投资人背后的行为逻辑。它为什么会出现这么大的波动,怎么样的情况下,它会出现这样大的波动,有哪些因素驱动它做出这些重大的波动,有哪些指标可以前瞻的帮助我们判断或者捕捉这样大的波动,这是我们在研究的。

  这是我们量价模型和基本面模型的简单对比,包括策略容量、交易频率、数据频次、股票可比性以及在因子基础逻辑上的差异,我们可以说基本面的研究或者基本面的选股的逻辑是非常注重底层因子的逻辑性,包括我们提到的ROE、ROA这些指标,它在长期的时间上是非常有效的指标,但是它的一个比较大的问题是,它如何去面对短期的市场的波动,这是基本面的选股,或者基本面的研究,它必须去面对的一个问题。而对于我们的量价体系,也就是技术面的选股,我们更关注市场中股价变化的本身,行情交易数据本身。这是一个非常高频的事情,所以对我们而言,我们在做一个相对比较高频的交易,通过这样的一个频度的持仓的变化来控制整体的风险的敞口,来达到一个非常平稳的收益率。打个比方,如果说施老师的投资是拿着一个鱼竿长期的在钓鱼,钓一个非常大的鱼,我们是拿一个渔网一把撒下去,抓那些小鱼小虾,这是我们的区别。

  在这个量价体系里面,我们在做的,第一是发现接触市场当中一些有效的量价的变化,大类的因子可以说有一些动量的因子结构、有一些反转的因子结构,我们都会把握这样的体系。同时对一些A股市场,我们会发掘一些特别的东西,因为A股市场本身投资者的构成,以及他的交易的制度的不同,导致了他会有非常多的独特的量价指标或者信号指标的产生,这些指标能够帮助我们捕捉一个很好的Alpha。这是我们在做的体系。同时通过一些统计学优化的方式,包括这边提到我们会用更多的人工智能的技术或者领域,在后面我还会具体来讲,我们用它来优化整个投资模型,优化整个投资组合确保我们能够在一个非常稳定的收益状况下保持它的风险相应的中性。

  除了这个之外,我们还有很大的一块是基本面的研究,但是我们的基本面的研究更多的不是一个自下而上或者是自上而下的模式,我们在做的是试图发觉一些行业一般性的盈利的逻辑,或者去发现这个市场里面比较一般性的基本面的因子,这是我们团队在做的一个事情。所以在里面我们可以看到有一个独立的基本面的研究团队,他们一直是在做基本面量化的工作,通过研究去发掘这一系列因子,帮我们的量化决策做出一个很好的支撑。同时我们会搜集一系列的另类的数据。大家都知道正常的基本面研究或者是一般性的基本面研究,他要关注公司本身,他通过调研、财报等等一系列的数据来监控它的标的本身的整体变化。在今天这个时间点上,我们可以通过更多技术的手段,能够实时甚至非常高频的拿到一系列的基本面数据,以此来帮助我们做一个整体的交易决策或者风控,这是我们一直在做的。同时我们也是会经过一系列的模型分析,无论是回归、分类还是聚类的方式,帮助我们达成一系列的应用。在应用层面,包括对于财报本身的真假程度的判断,包括净利润的预测,以及整体行业知识图谱的构建,这其实是我们到目前为止已经可以去尝试着做的一些事情。

  后面举几个样例。在基本面的研究里面,我们会有很多不同的类型,这是情绪分析,大家知道在任何一个市场阶段,无论是个股还是整个行业,或者是指数,这个市场当中投资人都有自己的情绪,我们可以通过在各个论坛或者说各个投资人的行为模式上把它抓取出来。这边举的一个例子是在美国应用非常成熟的一个情绪分析的数据服务商iSentium提供的情绪分析的结构,它是实时抓取推特上市场情绪的变化,这是一个富国的股票,通过实时自然语言的分析,我们常规会用到NLP的方式,把投资人对于股票的一些言论进行打分,有些是很负面的,有些是很正面的,然后来进行打分,基于这样一个实时的分数变化,来做一个多交易的判断。在国外这已经被论证是一个相对比较成熟和比较有效的另类数据的方式。

  在国内我们也可以抓这些数据,也可以通过第三方的服务商拿到这样的数据,我这边举例的超对称这样的机构,它一直在做这个事情,它也是实时抓取东财、股吧、雪球上的一系列用户的留言、点赞、发帖、回复,基于这个基础进行自然语义的分析,然后进行打分。还有个股的分析,这里举例的是2018年10月份某一天东财股吧里面对于个股热度的打分,我们不能说单一拿情绪的因子做一个交易是有效的,但是把这个单一的情绪因子加入到已有的多因子模型里头,它事实上是可以达到一个优化的效果的,因为在某一个时点上,这个市场有特别多的人关注某一个股票,说明这个股票本身的交易热度维持在一定的级别上。这是我们可以加入到多因子体系里面做出更好的交易的一个辅助手段。

  在基本面研究上另外一块也比较有效,就是经营性数据的预测,特别是对一些消费类的企业,现在电商已经非常发达了,基于这样一个消费类企业而言,我们可以在电商平台上做一个它的经营切片的分析。这边举的例子是飞科电器,我们可以通过它的天猫网站上的数据爬取来分析,当然电商网站上的数据爬取非常困难,因为有很多反爬的手段,但是也可以拿到一些数据,来实时监控它的经营数据的变化。这对我们而言有什么意义呢?因为通常情况下,对企业的经营数据监控以前是一个非常低频的状况,正常情况下可能拿到它的季报,在每个季度以后才能实时跟踪它的数据,或者是要实地做一些访谈,用这种粗放的方式来进行。但是现在可以通过实时的平台截面来拿到数据,它的有效性我们做了对比,绿色的这条线是整体的经营的销售额的变化,黄色的线是它线上的变化,在很大程度上它的趋势性是非常雷同的,这也意味着我们可以在一定的周期上去预测它整体的价格的变动。

  另外一个,我们自己也会做一些长周期的择时,因为我们的基础是一个多因子的模型框架。我们在多因子的体系上,以前是做一些中性化的处理,就是我做成行业的中性,或者对风格的暴露做一些中性和处理。但是我前面提到了,中国市场当中有很多你可以抓的Smart beta,或者我们讲的风格因子的Beta,我们也是通过设置一个最优化的目标函数的方式,在一定的中等的周期上去了解到可能这个时间段它是偏大票还是偏小票。可能在这个周期里面它是偏周期性行业、消费行业,还是偏TMT行业,这方面我们都有相应的技术手段,通过最优化的方式来达到这样一个效果,来做出一定程度上的中等周期的择时,这是在我们的模型里面也会用到的。

  短周期择时,大家都比较了解,说得粗放一点就是做T,我们会有一系列的产品,都会有一个底仓的模式,这个底仓我在持有的过程中,我是可以对它进行日内的交易的操作,从而增大整个收益率。这是我们公司整个短周期的一个发展的变化,最早我们也是从一个中高频的交易策略过渡到目前为止用计算机和人共同做这样一个短周期交易的模式。

  简单举一个例子,大家可以看到,很多人也会自己做,如果做了也都有体会,这是几种不同的方式,可以帮助我们识别一些短期波动的机会。比如说第一个讲到的联动的方式,平安银行(000001)和招商银行(600036)的对比,在某些情况下,这个市场中有一些先行的指标,它的反应或者它的波动对价格是有指导意义或者先行的意义的,这边是招商银行在整个银行板块里面,它在很大程度上都有一个先行的意义,所以它如果在一个时间点上出现一个大的波动的话,它会带领整个板块出现一个大的波动,在这个周期上,我们就有一个机会通过联动的方式来做短周期的交易。下面的日内趋势就是指数和个股的趋势变化,以及右边举例的突破、反转的一些技术面的变化,它事实上都是有效的。我们在短周期上都是可以通过这样的分析去把握日内的一些波动的收益,这是我们可以做到的,我们可以通过程序的方式做到,也可以通过日内交易员的方式做到,从而来增强整体产品的收益。

  目前为止,我们就把两边都会结合起来,用程序的方式我们也会副主日内交易员去做一个很好的交易,或者效率更高的交易。同时日内交易员也可以帮助我们去不断地把握一些新的指标,一些新的要素,从而来帮助我们的日内T0效果得到很好的提升。

  另外一块是我们比较强的,但是很多机构可能会忽略的一点,这就是交易执行的优化。我们为什么要讲交易执行的优化?因为如果对于一些中低频的交易,或者是基本面投资,他可能一年买入这个股票,然后持有,当中没有特别大的交易,这个交易本身产生的成本对他们而言其实没有多重要。但是如果是对于一个交易频率非常高的机构而言,特别是可能一年换手超过100甚至超过200,如果你不关心每笔交易产生的额外的交易成本,它会对你的整体收益率产生非常大的影响,所以我们必须关注这一点。

  这边举例讲你如何买入1手平安银行的股票,其实你有很多选择,大家如果自己做投资的话,可能用市价单,按市价买入,吃对价的方式买入,或者是挂某一个成交价的方式,在二档、三档到五档这样一个点上去挂入的方式买入。不同的成交方式它事实上产生的交易成本是不同的,我们统计了一下,如果是5块以内的股票,每一档对于它产生的收益的影响超过0.2%,大家可以看到中国国内的股票,在我们统计的时候,0—15元的股票占到绝大多数,所以我们必须关注这样一个交易执行的问题。

  买1手股票很容易,因为不论怎么样你都可以做一个简单买入。如果我要在一个时间点买入1万手的股票,它是不是意味着我如果要把上面卖1到卖5的单子都吃下来,我要承担非常高的交易的冲击成本。所以我们必须考虑有没有一种优化的方式,可以帮我们去实现一个低成本的交易的模式。这里举的例子是平安银行在某一个时间点上,正常情况下在全天的交易里面,后面应该会有一个很大的机会,你都可以以更低的价格去实现你的交易。所以在这种情况下,我们也会动态地去调整我们的交易的成交回报的期望。有一个算法交易的系统,它可以以一个非常动态的方式去跟踪整体的市场变化,同时去做一些短周期的判断,让我们的交易成本可以达到一个非常极致的点。大家都知道现在的市场里面可能很多量化机构,它会用TWAP或者VWAP,也就是时间加权或者成交量加权的方式来做下单,总体的也可以把交易成本控制得很好。但是我们这个带有短期预测的交易的模式,可以让整体的交易成本低于常规的算法交易的量,这上面对于我们这样的机构而言,它提供了一个非常稳定的收益的增益。

  另外一块也是我今天重点想提的,也就是人工智能的部分。当然现在市场里面大家提得也比较多,但是每一家的做法和方式都有很大的差异。人工智能是从五六十年代就开始火的概念,当中也是经历了非常大的波折和变化,但是在今天这个时点上,它已经发挥出了非常大的能量。我经常说为什么在今天可以迸发出那么大的能量,其实有三个因素,一个是基础算法的优化,我们这边提到的就是早期的感知机,或者是后面的BP的算法,反向传播的算法,包括后期的数据库的出现,或者一些新的算法的出现,尤其是在图象识别和语音识别的这些领域里面技术的应用,提供了一个非常完备的基础的理论框架和算法的框架。另外一块是我们今天有非常大的数据,又有非常好的算力,在这样一个三点结合的体系上,它就可以发挥出非常好的功效。所以在今天我们可以看到这个领域已经是在金融投资或者是在外部的应用领域得到了一个非常好的应用。有机器学习的部分,还有深度学习的部分,其实理论上两者是有很大的结合点的,为了能够清晰理解,我把它分开来讲。

  在机器学习里面,有回归分类、聚类的模式,这在很久以前就已经在金融市场里面得到了很好的应用,然后在深度学习领域,CNN、RNN、DNN(卷积神经网络、循环神经网络、深度神经网络)的应用,它可以帮我们达到一个效果。简单来讲是要达到什么样的效果呢?在一个非常复杂的三维平面上,往往我们的所有问题是去找到一个优化结果的问题,这个优化结果就是我要在一个非常崎岖的平面上找到一个点,这个点可以帮我实现某个程度上的目标的最优,这个点在这个三维平面上它反映的就是那个低点的位置,事实上我们就是要在一个非常崎岖的高维的平面上去找一个低点的位置,用到这些不同的神经网络的框架,这是我们要去实现的一个事情。

  用到的算法就是随机梯度下降的方法,我们也是在找这个领域的终点,它是整个高维平面的低点。我们用什么样的方式去寻找到这个低点?往往我们会碰到很大的困难,比方说我从顶上出发,向左边的这条路下降,如果下到某一个点上的时候,我可能已经在那个点里就下不去了,可能是这个山脊的某个鞍部的位置,在那个点上下不去的时候,这个计算就到此结束了,它告诉我这个点是最优的。但是我们用一个全局的方式来看,它可能是一个局部最优的点,但不是全局最优的点。所以现在我们会有不同的优化的算法去实现帮我们找到一个尽可能靠近全局最优的位置,这些也是我们现在利用神经网络的一个方式,去在股票市场里面达成某些预测的辅助算法。

  这是一个简单举例,它是一个动态的,是一个分类的例子。如果有一个涨跌的分类,或者有一系列的样本,它是好的,或者它是坏的,它是男的或者它是女的,要做这样一个分类的话,我在一个线性结构里面就可以实现。但是如果它的分布本身是一个非常复杂或者非常离散的状态,传统的线性的结构很难做这件事情。所以我们看到整个分布的模型的复杂化,我们要用到相应更加复杂的神经网络去对它做出预测、做出学习。讲这些内容可能大家不是很好理解,我举两个例子,这是在股票层面的应用,无论是在信号的发现、信号的增强,还是组合的优化、执行的优化方面,我们都会用到。

  大家如果炒股,可能常规的会用到一个指标,就是MACD这样一个指标模型,如果你沿用这个本身的模型做交易,因为它反应的是一个均线之间的差异,事实上就是一个长短周期的变化、长短趋势的变化,如果传统的按照这个指标去做交易的话,拉大来看的确也有一定的效果,但是现在我们通过神经网络的模式,通过深度学习的模式,能够达到一个怎么样的优化呢?我们可以把一个相应长时间维度上,或者中等时间维度上的趋势,跟一个短时间维度上的整体的趋势结合来做一个学习的处理和优化,最终来做出一个预测。那个虚线可能是用传统的数据做出来的一个结果。那个白线和红线是我们用人工智能方式优化了以后做出来的结果,我们可以在这个样本里面看到,它可以帮我们更加提前地去预测到这个趋势的某个前置的变化,这是我们目前在做的一项。

  第二项做得比较多,大家都知道量化投资基本上都会用所谓的多因子模型的框架。我们会从这个因子里面找出一系列的模型,比如说我刚才提到的,可能有一系列量价的变化、成交量的异常、开盘的缺口、跳空的缺口,这一系列都是技术面的指标。传统意义上我们用线性的模型,把这些不同的X放到线性的方程里面做一个回归,做一个拟合,来预测未来的股价涨跌幅度。在一个相对有效的市场里面,它带来的超额收益会逐步被摊薄。事实上今天我们可以用神经网络这样的一个结构或者用这样一个工具,帮我们去捕捉到这个非线性结构下带来的Alpha。我们会把这些不同的量价的因子做一个特征的提取,就相当于最初的这一系列X的点,然后会把相应的成交的数据输入到整个学习当中,让它去拟合在未来某个点上的收益率的变化和收益率的水平。在这样一个情况下,可以帮助我们更好地去预测未来某个时间点股价的变动或者变动幅度。右边是一个在短周期上的预测和实际股票价格变动的拟合的线,在今天我们已经可以做到一个非常好的胜率的水平,我在这个点上预测未来,这是可以实现的。

  这是我们的AI研究体系,我就不细讲了。

  到目前为止我们在AI的领域有7个研究员,有15个实盘能够应用的模型的体系,有超过800个交易日的运行,今天我们基本上管理的规模都会用这样的AI优化的方式来做提升。

  这是我们的系统架构,其实是一个非常完备的系统架构的逻辑,无论是在数据的采集,还是在整体策略开发回测当中,都会做一个很好的部署。现在也把这个AI实验室的体系加入到这里面,在各个环节去做一个整体的优化。

  这是我们的硬件投入,因为我们的投资方式跟常规的主动管理或者基本面投资有很大的区别,所以我们在技术端会花非常大的力气,无论是硬件还是软件的领域,我们都会做很多的事情,试图通过这样的方式把每一个细节上我能够把握的那些收益都抠下来,这是我们的CPU和GPU,GPU主要是用来支撑神经网络的运算。

  这是我们的数据采集,无论是交易所的行情的数据,还是常规的一些另类的数据,或者是第三方提供的一些指标性的数据,我们都会去做,因为这是我们做出交易决策的一个最核心的立足点。

  这是我们的交易系统。

  量化投资不会完全取代主观的投资,这个世界上巴菲特索罗斯这样天才型的投资经理一直会存在,而且一直会带来非常好的收益,这是我们认可的。像施老师这样的长期的价值投资者,他都是可以带来很好收益的,但是这个市场里面赚钱的方式有很多种,量化因为它本身可以重复、可以上规模的特性,决定了它必然在未来的发展趋势上能够赶上主观投资的步伐,至少今天在中国的这样一个市场中,在未来还有很大的空间,我们可以做一个追赶的动作。同时我们用到了很多人工智能的方式,它是开源的,是非常公开的,而且是各行各业都已经成熟的应用的技术。我们觉得人工智能是没法替代真正人类的智能的。我们有手工的交易员,也有机器的交易员,我们可以看到有些天才型的手工的交易员,他在某些盘口的位置做出的决策,机器是不可能做出来的,但是这是一个非常艺术或者非常有效的行为。所以我们一直觉得机器可能能够达到一个平均以上的水平,但是它没法超过一些顶尖的,非常艺术的,或者有化合反应的水平。但是机器是可以跟人类的大脑,或者跟我们的交易经验做一个很好的结合的,这是我们对未来的一个判断。我们觉得在未来的中国市场里面,量化投资还是大有可为的。

  今天我就讲这么多,谢谢。

  主持人:感谢陆总刚才的分享,我们接下来还是要进行一个互动环节,我们给出三个提问的机会给到现场的朋友。

  提问:我之前看过上交所的一个统计,机构程序化交易的账户在上交所的活跃账户里面的占比是非常低的,但是它的交易量达到了15%左右。欧美市场的程序化交易的比例现在也非常高、非常成熟了,但是中国市场还是散户主导的市场,在这种情况下,对一般投资者来说,您有一些什么样的建议?是打不过就加入,还是做一些自己的判断呢?

  陆政哲:您的问题是指对于一般投资人而言有怎么样的投资建议吗?

  提问:我其实对中国的量化投资也有一些关注,很希望这个领域可以发展起来,对以后的趋势判断您也可以讲一讲。

  陆政哲:其实对一般投资人而言,我们往往给出的建议是最好能够交给专业的机构,不论是专业的量化机构还是专业的主动管理的机构,交给专业的机构来做。如果本身他不是在这个行业花非常多的精力到整体的研究上,他其实是很难去把握那个所谓的Alpha的,或者在某些程度上,我们觉得我们赚钱了,但是底层你不知道你为什么赚到这个钱。所以对于大多数人而言,我们觉得还是通过交给机构这样一个方式来实现稳定的增长,这是最好的。当然如果个人投资者有非常好的感觉,或者有非常好的判断,我们也是认同它来做自己的一些投资。这个市场里面超过80%的个人投资者是跑不赢指数的,所以在某种程度上,如果你要做一些Beta型的交易,你还不如买一些指数基金的产品。当然,我们看到机构投资者里面,在长期的维度上跑赢指数也是一个比较困难的事情。但是我们还是建议让专业的人去做一些专业的事情,这样会比较好。

  提问:我想问一个另类数据方面的问题,刚刚听您聊到这一块,就我个人的经验,从去年开始另类数据在整个市场上是一个很热的主题,无论是买方还是私募,大部分都开始利用一些大量的另类数据。但是我感觉很多人使用另类数据还是处于摸索阶段。无非是两种,一种是国内的供应商,一种是国外的供应商,国内的供应商在数据标准化或者数据质量上有一些问题,国外的供应商在国内的数据覆盖率或者使用逻辑上也有一些问题。你们肯定也在用一些海外的供应商或者是国内的供应商,您能不能跟我们分享一下您在使用这些数据上的感受和您目前是怎么样的用法?

  陆政哲:另类数据的确是一个非常性感的主题,比如说当我举例子的时候,大家觉得这个东西好,它可能给我们带来另外一个维度的增益的空间,但事实上使用的时候它有非常大的问题。您刚才提到有国外、国内的数据,其实我们没有用国外的数据,因为我们没有做国外的市场。在国内有一系列的机构,我这边举例的是超对称数据,他们是怎么取这些数据呢?他在某个时间节点上会取一个截面,比如说今天东财的股吧里面,在某个时间点某只股票有多少发言,他把这些发言都摘录下来,然后通过自然语义的分析,比如说一个股票“中国平安(601318)”,有人说“太烂了,怎么还不涨”,这是负面的信息,他来进行一个打分。然后说“太棒了,未来前景广阔”,这又是一个正向的情绪信息,他们是有他们自己的算法,我们也会做一些探索。这个数据在应用当中有一个什么问题呢?我就说它的个股的热度数据是怎么出来的,比如说“中国平安”这个股票在股吧里面一天有500条跟它相关的发言,每条发言有一个发言的主体,他们是可以做一个主要的语义分析的,对它进行打分,然后下面有点赞的,有回复的,它会根据这个点赞、回复的数量做出一个加权的处理。事实上我们最终看到那个数据,比如说在沪深300我拿到了同样的数据,一个是加权的,一个是不加权的,加权的数据可能有超过30%在某个时间点上是正向的情绪。如果是用不加权的方式,用平均的方式,可能这30%都是负向的,就是他用不同的标准化的手段做出来的判断事实上是不同的,就在某个时间点上,我这个语义分析,通过平均的加权的算法做出来的判断是不同的,它意味着这个同样的数据我能得出不同的一个指标的判断,这是另类数据里面最难的一点,就是我如何把这些离散的、非标准化、非结构化的数据能够结构化到一个程度上,同时这个结构化的数据的本身它能够去满足一些同向的单调性的要求。如果说这个数据本身整体的判断都是有问题的,我后面用起来肯定是比较困难的,这是我们实际遇到的问题。但是在今天我们可以看到在个别的数据上,因为最终就是数据说话,个别的数据上如果代入到你的多因子的框架里头做这个事情,它的确可以让你的整个收益率的水平能够提升一个级别,这是我们必须认识到某些程度上,它的数据是可以带来增量的效果的。但是你要用单个数据去判断一个股票的涨跌或者股票的变化幅度,这是很困难的。这里面的核心还是如何把数据结构化做一个有效的处理,这是有难点的。

  另外一块是刚才提到的对于经营数据的预测,这方面它其实是一个强逻辑的东西,如果线上的一个变化是好的,用一个抽样的概率判断来说,它整体应该会是一个好的东西,这是一个强逻辑的,实实在在可以用的数据。但这类数据使用当中对我们而言又有什么问题呢?因为我们是量化选股,我们要同时兼顾全市场3000多只股票,这一类的数据可能整体覆盖的面也就几百个股票,所以这类数据目前对我们而言,在策略架构的框架里面,它也很难直接应用到里面。但是对一些做个股的,或者对一些从风控角度考虑,它事实上给大家提供了一个思路,可以实时的去追踪这个企业的基本面的变化,不同数据能够带来的增益和它的有效性是不一样的。

  提问:在中国的市场,这两个交易所对你的高频量化的监管是友好的还是普通的?

  陆政哲:这个问题首先看你怎么定义高频两个字,从目前国内大部分量化的交易频率而言,你要拿国外的高频标准来衡量的话,我们都不是高频,只是相对它的交易频率会比较高,可能日度、周度的做一些相应比例的换手。目前整个监管,今年开始对交易接入各方面也是有一个放松的迹象,所以从趋势上而言,我们会觉得监管对它的接纳程度和理解程度在不断地加深,有一个逐步友好的状况,比以前肯定要好一些。

  提问:你的团队选人是偏数学专业出身的还是偏金融专业出身的?

  陆政哲:偏理工科的多一些,因为我们的核心的东西就是做数据处理。

  提问:你现在用的系统是来自哪家的?

  陆政哲:因为系统有很多,从前端到后端都会有,就我们而言,我们都是自己搭的。我们有超过15个人的IT团队,就整个系统基本上从前端的策略开发到后面的相应的行情的系统都会自己搭建。

  提问:T0的操作方式现在比较火,在你们的感受下,你们觉得T0是不是做得越来越多就越来越难?你觉得T0这种趋势是变得非常难做,还是说在中国这个非常不有效的市场上会持续很长时间?

  陆政哲:T0能够存在多久,它的关键因素是在于目前的投资人结构能存续而就。我举个例子,去年下半年成交量只有2000亿的时候,这个情况下T0是很难做的,我指的难做是它能够带来的绝对收益的比重降得非常快,但今年春节以来市场又变化了,现在我知道市场上很多团队如果按照相应的单个产品来衡量,专做T0这种产品的,他在年后这段区间,年化收益能做到百分之四五十的绝对收益。所以我回答您这个问题,就是要理解两个前置的变量,第一是我们的投资人结构会不会很快的机构化,或者说指数化,如果像美股这样以被动投资占到非常大比重的市场,它的波动本身就降到了一个很低的位置,这对T0的策略是有一个很大的压制的。但是当这个市场的波动还是非常高的情况下,T0都是好做的。第二是这里面的竞争对手之间是一个怎么样的关系,当越来越多的T0团队进入到里面以后,未来肯定是一个僧多肉少的环节,但是我们觉得它能够维持的时间段还是比较长的,维持几年的时间,按照目前的交易结构和交易量的变化来看,我们觉得没有特别大的问题。

  提问:我们感觉机构的T0策略在主导,让它变得更有效的方面,感觉变化并没有特别大,主要的变化还是跟市场有关系?

  陆政哲:对,就看这个市场里面肉有多少,里面的水有多少。但是在去年下半年的这个阶段里面,我们明显地可以感觉到在一个低成交量的环节里面,那就是机构和机构之间的博弈,这是我们可以相对明显感受到的。比方说在去年2000亿的这样一个环境里面,我相信做量化、做偏高频交易的,他的交易量占到的相对的比重已经达到非常高的位置了。现在交易量重新回来以后,他们又降下去了。

  提问:之前一直都是手动T0为主,这两年有很多从手动T0转到程序化T0的,我们看到一些头部的私募依然用大量的手动T0团队来做,你们怎么看这个趋势?程序化T0和手动T0各自到了什么样的阶段?

  陆政哲:我们觉得是动态的,单一机构而言,这个压力来自他本身规模的变化,当然程序化T0是可以相应的实现一个比较好的收益,但是你看到很多机构在规模达到一定的瓶颈或者突破某一个瓶颈以后,他的底层规模扩大了以后,传统的偏程序化的那一块带来的绝对的收益率水平其实很大程度上往往会降下来,就是说程序化T0存在着一定的规模瓶颈,在这个瓶颈上很多机构会通过人工的手段来做一个弥补,因为它不是一个此消彼涨的关系,它是可以以一个相对比较融洽的方式共存的关系。如果对一个中小规模的私募而言,它其实不存在规模容量的瓶颈,所以在市场的成交本身比较活跃,或者市场里面水足够多的情况下,它其实一直都可以通过程序化的方式来实现这个事情。所以我们觉得程序化本身它不会消失,只是对于里面的单一机构而言,他们自己根据自己的规模和自己的技术的水平来做相应的调配,这是会有区别的。

(责任编辑:赵艳萍 HF094)
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门新闻排行榜

推荐阅读

    和讯热销金融证券产品

    【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。