【Understanding the Evolution of Circular Economy through Language Change】
最近感觉就算不做一些Fancy的模型或者是不用一些很厉害和抽象的技术,用一些很清晰的概念写出一篇通俗易懂并且有意义的文章也是很有价值的一件事。再加上之前学了Graph Machine Learning这门课里面的Temporal Graph也勾起了自己的兴趣,所以最近找一些有趣的应用的文章看看。
这篇文章是曼彻斯特商学院和他们的计算机学院的合作的作品,Manchester真的是一个非常棒的地方,自己喜欢的非常多的乐队都是曼彻斯特的出身,自己要是有幸去曼彻斯特读书估计会沉醉于Band and Music之中吧。好了不扯了,看Paper。
本文讲述的是通过语言的改变理解循环经济的变化,听起来就蛮有趣的对吧。作者也承认这个的动机受到了其他人使用这方面的技术对于科技的发展的研究的影响,在本文之中注焦于一个Key Concept – Circular Economy,什么叫做Circular Economy呢?所谓的Circular Economy(CE)指的资源在生产与消费之间来回的循环,而并非在消费之后就消失了的那种线性的状态。比如说可充电电池这类的东西,还有中国传统的那种桑基鱼塘也属于循环经济。
Methodology
所使用的方法是从各种乱七八糟的数据库里面找到关于CE的文章,作者在本文之中找到了共计3300份Paper。在预处理的时候,采用了Word Stemming的技术,并丢掉了停用词。然后使用LDA的方法对于文档之中的文字进行处理,主题的数量在文中限定为20个,而根据LDA的结果,其发现了CE的研究在2015年开始出现了一个系统性的转变。
文章之中调查并且比较的方法有两种,第一种方法是基于共现矩阵(Co-Occurance Network),在网络之中的节点是关键字,而其边则Indicate出现了Co-occurance,通过这样的研究可以发现,在如今的文献之中,在Business Model/Supply Chain/Product Design之间存在更加强烈的联系,而在之前的的文献之中,会更加的注重于Ecology / Industrial Economics / Environmental Management这种的单词。而这种发现也确认了CE在这些年之间经历了许多的改变。
上面的两张图就是代表了在不同的时间点,网络之中所发生的变化。
而除了共现矩阵之外,本文之中也使用了Word Embedding的方式来处理,其Word Embedding分别训练在两个时期的数据集之中,也就是2015年之前的数据集以及2015年之后的数据集。作者通过比较Circular Economy这个单词在两个数据集之中的向量的相似度,发现他们的相似度仅仅是0.195.而通过使用KNN的聚类方法,找到Circular Economy周围最接近的两个单词,其发现在这两个时间段之中同样是发生了改变
左边是在之前的早起的数据集之中的结果,而RHS则是在当前的数据集之中的结果,而两个时间段的分类,同样是以2015年为界。
Comments
自己也算是被标题给骗进来的,因为一开始以为这个是讲Economy的周期性的现象的文章的,自己还是蛮兴致勃勃的,不过细读之后原来讲的是关于环保经济这一类的东西,不过也还是可以学到很多的吧,算是看见了一个关于GNN和NLP在现实生活之中的除了Chatbot除了Translation的应用了。不过文章的作者可能是商学院的所以对于一些概念可能也没有那么清楚,自己就感觉对于两个单词的相似度直接的计量的方法是完全没什么逻辑的,因为这两个东西完全不是在一套逻辑下面进行的,深度学习这种东西会给你搞出什么鬼幺蛾子完全是不可控的,如果是在同一个网络框架之中计量还算是可以有解释,但是这个玩意完全就是两个不同的模型和两个不同的数据集,所以其结果可能说服力没有那么强,如果是自己做可能会使用Graph Embedding作为其Embedding的结果,起码从这个层次上来看,最起码还是可以一定程度上的考虑到在网络之中的地位的变化对吧。
Reference
Understanding the Evolution of Circular Economy through Language Change
Comments
Leave a Comment