基于树状结构RNN(Recursive)的推特流言/谣言检测 Innocentius | PhD Candidate In Management Science

原标题:Rumor Detection on Twitter with Tree-Structured Recursive Neural Networks

作者:MA, Jing, Wei GAO, and Kam-Fai WONG.(新加坡管理大学)

引用:MA, Jing, Wei GAO, and Kam-Fai WONG. “Rumor Detection on Twitter with Tree-Structured Recursive Neural Networks.” Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (ACL 2018), July 1, 2018, 1980–89.

摘要(简):自动的流言/谣言检测在技术上非常有挑战性。本文试图通过学习推特推文内容的非顺序传播结构以了解推特的标志性区别特点,并以此生成更强大的谣言识别鉴别方法。本文提出了两个基于自上而下(bottom-up) 和自下而上 (top-down) 的树状神经网络模型,用于谣言的学习和分类,这些树状的模型符合推特的自然传播格局。本文将该方法用于两个推特的公开数据集,结果表明这些方法比原先的最前沿方法有着更好的性能,同时有着在早阶段就能发现谣言的能力。

Review:

这篇文章其实是一篇会议文章,但是亦不乏我们可以学习的点。个人认为,这篇文章的亮点在于其跳出了普通的Sentiment Analysis(情绪识别)的界限,而转为试图理解推文中的肯定与否定,借助推特本身的传播结构,进而研究谣言推特可能的传播特征。同时,其将传统的Retweet,这一本身不增加特征性信息的行为视为对谣言的肯定,这也是比较新奇的发想(然而,单纯的RT或许可以在很大的程度上理解为对某一推特的支持,但是带有回复和感情色彩的RT就不太一定了,这点在今后的研究中也要基于考量)。

该文章将下游的推特回复分为了三种:Deny (Disagreeing),即评论该推特比方说“satircal” 或者”fake”(然而这样的单词方式其实并不一定准确,比方说fake后面可能跟的是“fake news”,或者这个”fake”一词本身就含有讽刺的意思) Support (Agree) (这个可能会比较容易判断), 和 Question (这一点也需要斟酌,什么样的语句在怎么样的情况下是对上游推特的发问,什么情况是对旁观者的发问?). 这是一个可以借鉴的研究思路。这个思路其实同样可以适用于比方说拥有语言情绪数据库的一些NLP数据集。

如果说这篇文章没能发在比较好的期刊的最大的问题的话,可能应该是可视性的不足。这篇文章并没有给出fake tweets和true tweets在传播中的明显的区别在哪里,同时也未能给出可视化的,可判别的图表和运算过程。总的来说,这应该是一个可以在很短的时间内可能还有比较不错的进展的一篇文章。今后可以借用该小组所用的一些公开数据集,对自己的一些分析算法进行检测。