【Convolutional Neural Networks for Financial Text Regression】
这个论文的主要的观点也是年报之中含有更多的信息,因为他们更正规并且包含了方方面面。之前的工作的主要的关注的方面是在预测波动的时候使用Sentiment Polarity,但是由于年报的长度实在是太长了,所以在以短文本那一块的经验来搞完全不可行。那么我们看看他是怎么做的
Problem Definition
这里就先定义一些在后文之中会使用的公式,比如说Stock Return Volatility,这个就被定义成为在一定的时间时间之内的股票的波动(A target stock over a period of time).如果以$S_{t}$作为股票在第$t$天的收盘价,那么在第$t$天的Return就是$R_t = \frac{S_t}{S_{t-1}} – 1$,而股票在$\tau$时间段的波动率则被记作是
$$v_{[t-\tau , t]} = \sqrt{\sum_{i=1}^{\tau} \frac{(R_{t-i} – \bar{R})^{2}}{\tau}}$$
Model
来看看模型,在Reports放进模型之前,他们的长度都被限定到了$m$个单词,那么小于$m$个单词的都被Padd了。输出的矩阵是一个Embedding Layer,这里的卷积层包括了不同大小的Kernel Size。
大意就是使用Tri-Gram,Four-Gram,Five-Gram对于原文进行操作。然后MaxPolling,再把他们Concatenate作为最终的输入向量,再通过Fully Connected Layer,就进行预测。
诶,后面好像就没有什么了,也没有其他的什么非常惊艳和可以学习的操作。自己倒迷惑这个是怎么被ACL的主席给选进去了,这也太水了,就是用三个卷积核的CNN然后再送进FC层就完了。黑幕黑幕。
Comments
这个文章倒感觉没有什么特别的可以讲的和学习的Point,可能是自己看了他之后的延伸的方法所以觉得这个工作过于简单了,又或者是和Financial扯上了关系,所以就更容易中一些。不过自己也感觉最近读的论文好像都有点水了,不知道是不是把经典的读完了还是什么原因,可能也有自己最近有点偷懒的原因吧。不过今天是因为出去玩了一天,回来才写可能也累了,就没有细挑论文,明天再好好筛选一下值得读的。
Comments
Leave a Comment