【Individualized Indicator for All: Stock-wise Technical Indicator Optimization with Stock Embedding】
这篇文章也是讲技术性分析的里面的一些方法,其提出了对于技术性分析的最根本的一个弊端,也就是并不考虑股票的内在的性质而是仅仅考虑公司的股价的波动。这就导致了就算两家公司在某一个技术性指标上面的表现类似,可是他们的内在的区别依旧是天差地别。而这基本面于公司的业绩表现是至关重要的,所以我们除了获得技术性特征之外需要获得这些公司的内部特征特征。
作者采用的方法和之前我们的那篇文章非常的类似,同样是使用基金经理的持仓的情况来作为公司的内在属性的体现。
上面这张图也确实漂亮。通过一定的方法从上面的图之中得到了一个股票的Embedding之后,再结合各种不同技术性的因子一起对于最后的股票的价格进行预测。这里的因子包括了下面的因子
看起来蛮简单,但是我们需要解决蛮多细节性的问题的,比如说怎么获得这个Embedding,不同的技术性因子的结合的方式又是怎么样的呢?
Approach
文章之中的算法是Random Walk算法,不过这里的Random Walk的方法有点像是反复横跳的过程,对于任意的一个股票的节点,选择一个对应的基金节点,然后从基金节点里面再选择股票节点,然后再选择基金节点,就这样的反复横跳的过程。
股票到基金的数学化的表示就是
然后基金到股票的数学化表示是
然后把基金的节点给丢掉,仅仅是选择股票的序列,通过Skip-Gram的方式对于股票的序列进行处理得到了Embedding 记作是$g_i$。
那么对于因子和Embedding的组合的问题,作者提出了一种称为是TTIO的框架,其中最重要的一个部分就是使用Re-Scaling Network的方法,分成两步走就是生成初始权重和权重归一化。
由于我们的Embedding也是非常不容易得到的,其中蕴含了很多的有用的性质,所以也不会使用特别复杂的变换的方法破坏这里的性质。
这里通过一个简单的线性变化得到Re-Scaling Score 然后使用Softmax函数进行归一化,其实就是做一个Attention,非要说的那么的高大上
$$r_{ij} = w_{j}^{T}g_{i}$$
然后得到权重
$$\alpha_{ij} = \exp(r_{ij}){\sum_{k} \exp(r_{kj})}$$
使用这个权重乘对应的技术因子$I_{ij}$获得优化过的因子
$$I_{ij}’ = I_{ij}\cdot \alpha_{ij}$$
之后使用信息系数作为目标函数对于这个单层函数进行优化
$$\max||corr(I_{j}’, R)||$$
实验的结果如下所示,其中的Raw表示的是BaseLine,使用原始的因子进行处理,而使用Norm re-Scales是对于原始的因子进行初始化,NoEmbeding是不使用Embediing而是仅仅将Raw丢进一个单层的神经网络之中自主的学习权重。而还有一种方法是叫Complex Concatenate的方法,这里不是使用上面的Attention的方式,而是将向量和Raw的值连接起来丢进两层的神经网络之中。
可以发现其实Raw的效果还是非常的不错的,甚至比Norm的效果要好上很多。
上面的使用的度量的标准是使用累积收益作为评判模型的标准, 这里和之前的自己的那个评判标准不一样,之前是使用回撤的方法进行模型的评判,但是在这里的使用的方法还是使用Return进行度量。而最大回撤和Return的方法到底哪个更是适合你的评判标准呢?这个可能是要结合个人的风险偏好这种东西处理,如果是风险偏好的话就可以选择Return如果是风险厌恶的话就可以选择最大回撤的方法。
Comments
这里的使用的方法是使用Skip-Gram的方法对于股票序列进行处理,但是在这里的得到的Embedding并非是主角,而是仅仅在计算Attention的时候出现过了一次,以帮助得到更优的技术性的指标。其实自己还是有一些困惑的点就在于这里为什么不设置一个仅仅使用Embedding的Baseline的结果,以及这里为什么也不多提供一个回撤的数据信息。不过看来使用基金作为企业之间的一种联系是非常常用的一种方式了,自己以后也可以考虑在这方面做一些基础性的研究工作。
Reference
Individualized Indicator for All: Stock-wise Technical Indicator Optimization with Stock Embedding
Comments
Leave a Comment