社交网络虚假新闻识别方法
浙江交通职业技术学院学报,第21卷第2期,2020年6月
Journal of Zhejiang Institute of Communications
Vol.21No.2,Jun.2020
社交网络虚假新闻识别方法
楼靓
叉乘
(浙江交通职业技术学院,杭州311112)
摘要:随着移动互联网等信息技术的发展与普及,社交网络中的谣言和虚假新闻
的传播也更迅速、影响也更广泛,造成了不良的社会影响与经济损失,同时对监管
部门的响应速度提出更高要求。提出一种面向社交网络的虚假新闻检测方法,该方
哪组词
法分析社交网络中新闻文本的语言特征,并结合基于BERT全词覆盖模型抽取中文
字向量来联合构建新闻文本特征。为结合这两类特征,提出了一种改进的TextCNN
人间四月天的唯美句子
模型。在实验中该方法取得了更高的精度,证明了该方法的有效性。
关键词:自然语言处理;虚假新闻识别;BERT;TextCNN
有关国庆节的黑板报
中图分类号:TP391文献标识码:Adoi:10.3969/j.issn.1671-234X.2O2O.O2.O21
文章编号:1671-234X(2020)02-0106 0引言
学而时习之不亦说乎的意思
近年来,随着信息技术、互联网及移动互联网等技术的发展和普及,越来越多的人使用移动设备,通过社交网络APP获取信息和新闻资讯,如微博等。据2019年一季度微博季报显示,截至2019年三月底,微博的日活跃用户已达到2.03亿,其中94%为移动端用户。然而,社交网络作为快速发布信息的平台,也为谣言和虚假信息的发布和传播提供了便利。据2015年中国社科院报告,接近60%的虚假新闻选择在微博首发。因微博的短文本属性和快速评论转发的特性,使得虚假信息的发布成本极低,传播速度快,影响范围广泛。在特殊时期,此类虚假信息和谣言如不加以甄别和控制,可能会造成较严重的负面影响。例如在2020年的新冠肺炎疫情期间,虚假新闻的快速传播曾造成大量的负面影响,甚至引发恐慌。因此,快速识别虚假信息成为舆情监控工作中非常重要而又具有挑战性的工作。传统虚假新闻的识别主要依赖用户05
的自发举报及工作人员的人工审核,需耗费大量人力,且此类监控手段具有较强的滞后性,通常举报
上来的虚假信息已传播一段时间,并已造成一定的影响,这种举报-审核的模式无法将虚假信息扼杀在摇篮中。
随着大数据和人工智能技术的发展,基于机器学习、深度学习和自然语言处理等技术的自动虚假信息识别方法被陆续提出。Castillo et吐⑴首次提出面向Twitter的虚假信息识别方法,该方法抽取了多种特征,包括用户特征(如注册时间)、文本统计特征(如文本长度)、传播特征(如被转发次数)和主题特征(如所属话题),并使用决策树模型(J48)训练这些特征。受该方法的启发,其他多个工作也遵循类似的统计特征结合监督分类器的设计思路,如引入情感类特征⑵,主题分布特征B 等。然而,Gupta et al在他们的研究中指出,传播类特征、用户特征等并未取得显著的效果,且特征构建复杂,用户特征的获取也不利于保护用户隐私。另一类方法主要基于文本语义向量,如Woid2vec等⑸文本词向量,并结合文本分类器(如
收稿日期:2020 -03-17做葡萄酒怎么做
作者简介:楼靓(1990-),女,浙江义乌人,助教,硕士,E-mail:*********************

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。