1 1 1 1 1 1 1 1 1 1 Rating 0.00 (0 Votes)
2017-02-21 萝卜投研 萝卜投研

 

中泰证券2017资本市场年会近日在杭州召开。年会期间,通联数据研发的智能投研平台--萝卜投研(RoboR)低调亮相,受到与会的公募、私募、银行、保险等机构的关注。作为年会的特邀主讲人,通联数据智能投研总监向伟博士就人工智能时代的基本面投研做了演讲,以下为部分精选内容。

 

 

海量数据和运算资源,让人工智能迎来爆发点

 

“各行各业的人们在五至十年之内,都不用担忧被机器抢饭碗的事情;我们更应该考虑的是如何借助AI来优化工作效率”

 

现在AI技术比较火,但作为AI领域的研究者而言,我本人的态度还是比较切实而保守的。就目前的观点而言,各行各业的的人们在短期——也就是五至十年之内的话,都不太需要担忧人类被机器抢饭碗的事情。我们在短期内更应该考虑那些比较切实的问题,比如人类如何借助AI来提升技术,优化人类工作效率,进而可以让人类腾出更多精力,做出更多有创造性的东西。

 

人工智能技术发展至今有60多年的历史,“人工智能”是60年以前阿兰图灵和当时美国的一些梦想家提出的,他们坚信可以造出像人一样推理和学习的机器。60年代,诺贝尔经济学家获得者Herbert Simon进一步奠定了人工智能领域初期的理论基础,他的假设是,用计算机里的符号就可以产生一切智能,智能来自符号的排列组合,这样人们便可以借助一些模型和框架的设计,使得我们的机器能够具备一定人的推理、演算、建模能力。

 

接下来,人工智能研究学者也一直在参考人脑究竟是怎样记录和推理信息的。因此演化出了另外一个流派,就是基于神经网络结构的知识存储方式,人们开始尝试在机器中搭建这样一个结构去效仿人脑。

 

为什么在深度学习大火之前,这类神经网络模型都没有火起来?这个其实和真实世界所提供的外界条件也是息息相关的。一方面,训练这些复杂知识结构的模型需要海量的训练数据;另一方面,计算机硬件上需要大量的计算资源去迭代模型和知识结构的压缩。

 

随着摩尔定律的发展,人类的数据存储资源和模型运算资源逐步充裕,这类模型的训练也变得可行。因此人类近年来在追逐更高的目标,即这些复杂的模型知识结构是否能够帮助我们求解更难的问题。

   

 

人工智能如何提升基本面研究的效率

 

下面的案例展示了通联数据是如何将AI运用于基本面研究,辅助投资者的工作,进而提升他们的工作效率。

 

  • AI如何帮助研究员更快地“找数据“?

 

基本面研究员每天必干的事情是扫描各个上市公司的公告,这个信息量非常大,尤其到年报季,买方、卖方的分析师有可能需要两三个星期去消化完这些公告当中的信息量。尤其对于一些新手来说,年报、季报一般是200页的样子,有各种类型的数据和逻辑,消化这些信息量所需要花费的功夫是非常大的。

 

但当你做了100家到200家之后会发现,这个过程是极为相似的,这其实就是一个机器可以帮助到大家的点,为什么?因为机器擅长做重复的事情,一旦我们找到一种人脑知识结构和机器对接的方式,我们就可以通过人工智能逐渐去理解各类公告,通过人工智能技术整理出来的结构化的数据,转化为结构化系统化的报告。

 

第二个,做好了这些知识的抽取和压缩之后,机器可以帮人类解决的另一问题就是信息检索。因为人脑的存储结构,其实是序列化的存储方式,我们如果要回忆一样很久之前事情的细节,有可能要花费相当大的精力。而我们却可以通过搭建一个搜索引擎来辅助人脑这方面的软肋,将这些数据迅速的进行定位。

 

再接下来就是整理数据。整理数据的工作其实也存在效率问题,一般上市公司披露的公告是PDF文件,在传统的时代,大家阅读这些公告的方式是打印出来,在纸上做一些标记,然后人工整理出一些数据塞到模型里。但是2010年之后,互联网信息化发展的进程提速了,很多新兴的分析师也都是90后,都是在互联网时代成长起来的,这个时候怎么通过互联网化的工具来帮助大家解决问题呢?我们也可以通过人工智能来解决。

 

传统投研流程中,是将这些PDF文件中一个个数字一家家公司整理出来,而我们是借助人工智能技术去解析——这篇报告的核心对象是谁、核心数据有哪些、发生的事件是什么,这是我们所谓的浅层次智能化。

 

接着,对于传统的公告而言,大家看到的一张纸上的数据,所蕴含的信息量往往是非常有限的,为获取更大更全的信息量,我们要阅读更多相关的报告。而当我们把这些知识结构化之后,通过人工智能技术可以将这些数据按照一定的逻辑结构索引在一起,当你看到报告中的一个数据时,它所蕴含的信息量却远不止这么简单。

 

以白云机场的数据为例,描述的是某一个月这家公司的飞机起降的次数是多少,而利用人工智能技术,我们能将这些报告中的每一个数字,每一个人,每一家机构背后的含义理解透彻,并以可交互的方式呈现——这些报告中的数据会转化成为可点击的链接,当我点击进这个数据后,就可以进一步看到它的历史趋势、它和行业平均值的比较情况,或者在同行业当中毛利率是偏高还是偏低的等等。

 

 

 

如此一来我们所获得的信息量就远远超过了纸面静态的报告,这对于广大投资者们提升屏幕显示信息的效率是非常有效的。

 

对于新闻资讯我们的思路也是类似的。我们系统每天累计入库新闻有数万的量级,但是这么多篇的信息中包含有大量的转载、行情评论等垃圾信息,这些对于基本面研究员来说是没有营养的。

 

此时人工智能技术可以如何辅助投资者的工作呢?我们对互联网新闻转载链进行深度地分析,自动去帮助大家甄别出哪些新闻来自最权威的新闻源,哪些是第一手的信息,而哪些是转载的。这样一来,机器能够帮助大家把每一个行业的新闻缩减到300篇之内,这才是人脑可以消化的信息量,同时又可以为投资者省出很多时间,去干其他更有价值的事情。

 

除了控制新闻质量,我们也在尝试理解新闻当中的内容。当大家读完一篇新闻时,会从字里行间提炼出一些观点,但当关注的行业范围比较广泛的话,一般人脑很难实现快速高效地切换。而机器在经过一定量的训练之后,可以识别出一篇新闻中核心的指标,甚至去进一步分析核心指标的趋势,和关系点之间的支撑关系:

 

 

 

只要我们能够合理构建出知识支撑的相互关系,这对于大家压缩这些信息的效率也是非常高的,这个就是类似于AlphaGo去解决棋局的一个过程。

 

以上给大家列举的案例是找数据的过程,其实找数据通过智能化之后,可以缩减大家在平常找数据花的百分之七八十的精力,这个精力可以留在更高的思考和决策方面。

 

  • AI如何提升投资者在逻辑思维方面能力?

 

AlphaGo为什么可以战胜人类,是因为这些人类棋手白天练完之后晚上就睡觉了,但机器不用睡觉,它还在学习。同样的,平常分析师每天看完这些公告、新闻、研报之后就去休息了,而我们的机器人每天不分昼夜都在解读这些数据之间的逻辑。这样一来,我们这个系统的智商会随着时间增长,这也是我们通联数据有别于传统数据库软件供应商的地方,我们在基因层面就有着天然的优势。

 

我们可以看一下机器按照知识逻辑抽取出来的数据是怎样的。比如说对一家传媒公司而言,一些C端用户的热度数据核心数据,我们的机器不断在重复这些数据逻辑组织的实验,并借助人类新撰写的新闻和研报来“复盘“,慢慢的,他组织这些数据逻辑的方式和呈现结果就会更加合理。

 

 

又例如一个地产公司,我们通过机器把成本端的数据——“它“拿了哪些地,多少钱拿的,”它“的盘在哪些地区销售,楼盘相互之间定价的关系等等的碎片化信息组织起来,如此以来大家对一个楼盘的估值就会缩小到一个非常小的范围内。

 

 

 

还有像第三方的咨询报告,传统来说也凝聚了分析师很多线下采集整理数据的工作,同样我们可以通过机器去对报告中的数据逻辑建立索引,并组织成线索化的呈现。机器甚至可以自动识别投资者的关注偏好——比如当他们关注这类数据时,究竟是看三个月的趋势就可以做投资决策,还是要看到六个月甚至三年的。

 

 

简单来说,就单纯找信息,组织信息这件事情,我们已经能让AI技术帮助我们提升效率。

 

  • AI如何辅助投资者做投资决策

 

当我们对一家上市公司进行估值时,会先找一个助理或者研究员,先翻20篇相关报告拉一个财务预测底板出来。然后再结合自己手头采集的数据以及自己的观点假设,参考企业的利润趋势以及行业的情况,这样才基本把一家上市公司的估值猜到靠谱的范围之内。

 

而人工智能能为我们做什么?刚才其实也解释过,在信息整理的过程当中,我们会训练机器去拆解各大卖方分析师建的模型,研究究竟每一个分析师的各项能力强在哪里,弱在哪里,这些数据相互之间的支撑关系是怎样的。

 

 

 

大家可以看到,借助人工智能技术,我们能在财务模型的建立过程中,帮投资者完成自动化的账面配平。同时,这个财务模型不再是一个静态的模型,当行业的数据动态每天都在往前走的时候,这些数据都会体现在最终的财务预测过程中,这个可以高效实现我们建模过程中的一些自动化更新的目的 。

 

  • 当拥有了足够的数据之后,我们该如何去深入挖掘投资线索?

 

最近,明天系的案例比较火,我看了下网上的分析贴基本是人工做的,大家做的事情就是把明天系的公司关系一层一层挖下去。这样的话我们会发现一个现象,我这个图只展开三层就这么多连接点,人眼看的已经比较累了,再遇上那些存在一些猫腻的公司,可能就有五六层要挖,这其实已经超越了人眼的辨识度和人脑可以处理的复杂度了。

 

 

 

而当机器经过一定的训练之后,完全可以自动剖析公司之间的利益关系。当我们把一些公司输进去,机器挖掘出来的图是非常清楚的,这个就是借助机器在效仿人类的挖掘能力,把一些无关利益的节点自动隐去。继续拖动这个三角形我们会发现,实际上藏在最后的才是最核心的点,这就是机器极大地提升了人脑辨识的能力,使得人类可以高效地获得利益链的剖析结果 。

 

我们最后再说一下积累方面的问题。如今知识积累久了之后会非常碎片化,有可能三个月之前讨论过的一些并购阶段分析、业绩预估等等,我完全不记得了,但是机器可以把这些知识串联起来,这样借助机器索引翻这些观点和模型的话会比较方便。

 

最后总结一下,人工智能变革的路和18世纪工业革命非常像,在18世纪的暴发户是最先做工业革命的人,在21世纪其实是敢吃螃蟹的做智能化的人;在18世纪从事变革的获益者是资本家,而现今则是数据资本家;在18世纪达到变革的目标靠资本驱动,而在21世纪是用智能化科技去驱动。

 

 

 


 

 

 

萝卜投研是由通联数据研发的智能投研平台。其中有丰富的金融大数据,涵盖了房地产、医药、汽车等深度行业数据以及社交、电商、招聘等特色数据。

 

除此之外,萝卜投研还提供智能金融搜索引擎,结合投资逻辑展示资讯;支持一键载入智能财务模型;以及挖掘上市公司股权、高管关系的知识图谱,帮助用户发现更多价值投资机会。


Add comment


Security code
Refresh