量化投资

量化投资“魔法公式”:结合巴菲特和索普的优势

FT中文网撰稿人夏春:不掌握高频交易技术、因子模型的投资者,是否仍有机会从巴菲特投资哲学和索普量化思想中学到一招半式?普通投资者也可受益的公式是什么?

【编者按】量化投资近几年在中国引发热议,但是到底有多少人真正了解其含义?为此,FT中文网推出“量化投资趣谈”系列文章,也欢迎广大读者参与讨论和交流。本文是该系列文章第三篇。编辑事宜请联络tao.feng@ftchinese.com。

我在“量化投资趣谈”系列的第二篇文章中提到,由索普开创的量化交易技术发展到现在备受瞩目的高频交易时,感到意犹未尽,在进入本篇的主题前,先讲一段故事。

对冲基金利用社交媒体的高频信息交易

电影《决胜二十一点》第一幕就是,哈佛医学院负责招生和奖学金评审的主任对男主角说,今年一共有76位申请者竞争罗宾逊奖学金,最终只有一位幸运儿。他/她的经历光impress(打动)评审委员会还远远不够,必须dazzle(用现在的网络流行语来说就是“亮瞎”)到大家。

在香港大学的七年教学生涯中,我总是在每一门课程开始时,就模仿着对学生说,如果你们将来继续深造,要申请奖学金来找我写推荐信,最起码要让我觉得impressive,如果要让我一辈子都记得,必须dazzling。在这七年里,我教过的本科生、硕士生和博士生至少有1500名,我大致上给40多位本科生写过硕士学位项目申请的推荐信,精心指导过的7位本科生——他们目前在美国和欧洲一流经济和金融系攻读博士学位(过去七年港大经济金融学院毕业生选择攻读博士学位的据我所知不超过20人),我自己的两位博士生毕业后分别在高盛中国策略部和中国人民银行上海总部工作。

不过以最短时间dazzle到我的是一位印度来的硕士生阿斯温•戈亚,他本科专业为计算机,辅修经济金融。2013年春季,我在《对冲基金》课程中简单提到投资者的情绪会对证券价格产生影响,比如大家情绪高涨时更可能推动价格上涨。过去发现的情绪的代理指标各有各的劣势,最新的思路是从Facebook、Twitter或者微博上实时读取短讯(我记得那时候微信还没流行开来),然后通过文本算法程序去判断每条短讯里包含的情绪是正或负,然后加总分析,并以此为依据建立证券组合。实际上我本人的博士论文就是从理论上解释这个发现。我提到2010年有三位计算机专家发现利用tweets里的情绪信息预测道•琼斯指数每天的涨跌有超过85%的准确性。

一家叫做Derwent的对冲基金,按照他们的文本算法程序试运行了一个特别的情绪基金,在第一个月里取得了接近2%的回报。可能实际融资并不容易,Derwent后来将这项技术得出的买入卖出信息卖给有兴趣的投资者。另外一家叫做MarketPsych的公司,则收集证券价格数据、媒体热词、投资者情绪、经济不确定性和政府稳定性等量化指标来进行投资(见图1)。作为对冲基金,他们在2008-2010年的业绩表现超越标准普尔500指数25%,随后转型成为以数据发布、量化研究和咨询业务为主的公司。而全球最大的对冲基金桥水(Bridgewater)也公开他们使用社交媒体的实时信息以掌握全球经济每天的变化。

实际上,金融学近年来大量文献指出,虽然市场价格对于新信息的反应非常迅速(即市场有效说),仍然有一些公开的信息可以对于一段时间后的股价具备预测力。例如“谷歌趋势”上面的搜寻量指标,可以对两周后的股价升跌有显著的预测力。不过这类研究结果发表后常常被投资者大量采用从而失去其效力,而坚持市场有效说的学者认为,这些发现只是为了迎合行为金融的流行潮流而制造出来的统计假象,或者是为了发表而滥用数据挖掘的结果。我倾向于相信一些基于社交媒体大数据的未发表的研究结果对于投资有帮助。

当时我的介绍非常简单,我告诉大家只有到夏季的《行为金融》课程才会把相关的文献集中整理后发给大家。然而一个月后,在学生自选主题的课程项目演示中,戈亚让所有人大吃一惊,他最独特之处在于,想到把tweets包含的情绪信息用于预测二元期权的未来价格。简言之,买入(卖出)和某证券挂钩的二元期权是预期该证券在接下来较短时间(比如数小时)内价格将上涨(下跌),这种短时间到期的特点让低频基本面数据变得没有什么价值,而反映市场情绪的高频数据则对于价格预测帮助颇大。另外,由于二元期权的回报结构特殊,投资者通常需要有55%的准确度才可能盈利。戈亚首先建立了一个包含400条tweets的数据库,然后教会语言处理软件包LingPipe每条包含的情绪为正还是负。接下来,他编写的程序以毫秒的高频速度实时读取和一种证券相关的tweets,此时具备自我学习能力的LingPipe就可以判断这些最新tweets体现的正负情绪,当加总后的正情绪tweets数量超过负情绪总数的55%时,他就买入对应的二元期权(实际上,这个准确度百分比根据买入时间点的价格而随时变化)。他还讨论了三位计算机专家方法的不足,如何利用多重信息来源补充tweets包含的信息,以及如何将同样的思路运用到其他金融工具的交易上。当然,同样的策略可以同时运用到上百上千支二元期权上,成为统计套利的一种。

您已阅读27%(2013字),剩余73%(5346字)包含更多重要信息,订阅以继续探索完整内容,并享受更多专属服务。
版权声明:本文版权归FT中文网所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。
设置字号×
最小
较小
默认
较大
最大
分享×