Press enter to see results or esc to cancel.

【What You Say and How You Say It Matters: Predicting Financial Risk Using Verbal and Vocal Cues】

Introduction

本文还是非常有意思的,采用了一个多模态的模型(Multimodal Model),同时分析公司的年报的文字的内容以及公司的CEO的说话的Vocal Feature,以其作为特征输入进模型之中以预测公司的股价的变动。这个想法非常的有趣哈,当然个人在觉得既然都已经加入了声音的特征,不如再加个人脸识别系统把CEO说话的时候的神态给捕捉到了,再一起输入模型之中也是一个很有意思的事情,不过这个可能计算资源的需求有点大就是了。

好接下来我们看看具体是怎么做的,首先是数据的获取,文章采用的是从Seeking Alpha上面下载的Earning Call的数据,其中包含了两种数据

  1. Introduction Section:Read the forward-looking statements and provide their information and interpretation of their firms performance during the period.
  2. QA Section : Analysts(People who analysis the company information) deliver the question and the CEO answer the question.

资本市场上面也有很多因为Earning Call的信息导致的股价变化,作者所做的就是用更加科学的方法来看是什么导致的变动吧。

文章之中提到了其他人的一些工作,自己也就在这里列一下,因为不得不说在金融这方面的应用确实不多,列出来可以让大家也自主的去找有兴趣的看看

  • Bernard et al (2007) 发现了可以通过过去的股价的变动对于未来的股价进行预测,从此开启了炒股之路。
  • Kogan et al(2009)发现了仅仅使用BOW模型结合过去的股价变动就可以达到超越过去所有的仅基于历史变动的模型的效果。
  • Mayew (2012), Hobson et al(2012)也使用了语音语调来分析股价变动,不过他们用的是第三方的软件。(在搞学术这一块似乎还真有自己写代码到直接用软件的鄙视链。)

Model

整个的任务很明确,就是一个经典的回归任务,属于有监督学习的范畴,输入的数据是公司的Earning Call的信息,包括了Verbal的信息以及Textual的信息。而输出则是公司的股价变动率.

文章之中以$M$记作所有的Conference Call的数量,而以$N$记作最长的句子的长度。以$X_j$记作是第$j$份Earning Call的信息,其中$X_j = [T_j,A_j]$,$T_j$是一个$N\times dt$的矩阵,代表了Earning Call之中的文本信息,$N$是最长的句子的长度,$dt$是文本的Embedding的长度。而$A_j$是一个$N\times da$的大小的矩阵,代表了从Earning Call之中获取到的语音的信息,其中的$da$代表的是Audio Information的维度。而$y_j$和$\hat{y}_j$则分别代表了真实和预测的股价波动。

在这样的一个Multimodal Deep Regression Model之中包含了两个组成成分,一个组成成分是一个双向的LSTM,另一个组成成分也是双向LSTM。看到这里大家应该也猜得到这个是中国人写的,毕竟门前有两棵树,一颗是枣树,另一颗也是枣树这句话对不少中国人还是有很大的触动的。第一个LSTM抽取的是单独的文本信息或者音频信息,而第二个LSTM则是将这些信息混合在一起,我们可以看看图

可以看到就是将Raw Material分别塞进两个Bi-LSTM之中,然后将输出Concat,再塞进一个Bi-LSTM之中,还是非常直观的一个模型。

模型的Objective也是比较直观的。任务的目标是合理的预测股价的变动率,看看他的定义是什么:

$$v_{[t-\tau,t]} = \ln(\sqrt{\frac{\sum_{i=0}^{\tau} (r_{t-i} – \bar{r})^{2} }{\tau}}) $$

其中的$r_t$是在第$t$天的Return价格,而$\bar{r}$则是从$t-\tau$到$t$这一段时间内的股票的Return价格,什么叫做是Return价格呢?

$$r_t = \frac{P_t}{P_t – 1 } – 1$$

$P_t$就是股票在第$t$天的收盘的价格,作者选择了不同的$\tau$的值来判断模型在预测短期和长期的股价波动的能力。在最后的损失函数的选择阶段,作者选择的是常规的均方误差(MSE )作为结果。

Reference

What You Say and How You Say It Matters: Predicting Financial Risk Using Verbal and Vocal Cues

Comments

Comments are disabled for this post