微博信息传播的影响因素研究分析_赵蓉英
新浪微博评论不了欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟实践研究
●赵蓉英
1,2,3
,曾宪琴1
(1.武汉大学
信息管理学院,湖北
武汉
430072;  2.武汉大学
信息资源研究中心,湖北
武汉
430072;  3.武汉大学
中国科学评价研究中心,湖北
武汉430072)
微博信息传播的影响因素研究分析
*
*
本文为教育部人文社会科学基金项目“馆藏数字资源语义化深
度聚合的理论与关键技术研究”(项目编号:13YJA870023)和国家社会科学基金重大项目“基于语义的馆藏资源深度聚合与可视化展示研究”(项目编号:11&ZD152)的成果。
要:在Web 2.0时代,信息发布的主动权完全开放,信息分享度的差异巨大。了解信息传播的影响因素有着理
论上和现实上的重要性,而目前对这一问题的研究比较零散,大都停留在简单观察总结阶段。文章以被
广泛接受的流行三要素理论为出发点,依托新浪微博,对影响信息传播的诸要素进行实证研究。研究发现,粉丝数是微博转发量的基础,一般每增加1万粉丝,转发量增加8次,活跃度和时间对转发量有一定的影响,但影响不显著。实证分析微博信息传播特性,对于微博营销策略、识别僵尸粉等实际问题给出建议,并对未来的研究方向进行展望。
关键词:信息传播;微博;影响因素
Abstract :In the era of Web 2.0,the initiative of releasing information is completely opened and the information sharing de-gree is different.It is important in both theory and reality to understand the influencing factors of information dissemination.Howev-er ,the present studies on this problem are scattered ,most of them stay in the stage of simple observation.Based on Sina Weibo ,the paper takes three widely accepted popularity elements as the starting point and makes an empirical study on the influencing factors of information dissemination.The paper finds that fans number is the foundation of transmission number.Generally ,the transmission number increase 8times with each additional 10,000fans.The active degree and time has a certain effect on the transmission num-ber ,but the effect is not significant.The empirical study analyzes the characteristics of micro-blog information dissemination ,and provides recommendations for the practical problems ,such as marketing strategy of micro-blog and identification of zombie powder.Finally ,the paper gives prospects for the d
irection of future research.
Keywords :information dissemination ;micro-blog ;influencing factor 人是具有社会性的,每个人都有与他人交流和分享信息的需求,在Web 2.0时代,信息的传播进入到一个全新的时代,微博、人人、Facebook 、Flicker 等在线社交网络(Online Social Networks )已经成为人们获取信息和发布信息的主要平台之一,尤其是微博出现以后,信息发布的主动权完全开放,140字微博的短小和便捷,让人们随时随地都可以发送信息。在令人咋舌的信息狂潮中,信息分享度巨大的差异化,让信息分布长尾部分的信息面临着沉重的竞争压力
[1]
。究竟是什么影响了信息的传播?为什么有
的帖子会被疯狂转发,引导话题走向,而另一些帖子却默默无闻,引不起一丝波澜?作为普通的信息发布者,我们关心自己的微博状态怎样才能被好友关注、转发;作为意见表达者,我们关心自己的质疑和呼吁如何才能感染到更
多的人;作为产品推广专员,我们关心怎样让自己的广告描述到达广大的目标客户体。
1微博信息传播的影响因素
信息传播活动涉及4个要素:信源、信宿、信道、信
息。由此对信息传播效果产生影响的因素主要有4个方面,即传播者、受传者、传播渠道和传播环境
[2]
。本研究
对微博信息传播影响因素的分析是建立在流行三要素原理的基础上的,流行三要素总结的是事物流行的法则,对微博流行同样适用。流行三要素理论在马尔科姆·格拉德威尔(M.Gladwell )的《流行三要素》一书中有着系统的阐述。要想制造流行,首先流行物体要具备流行的基本要素,作者将这些要素总结为3个法则:关键人物法则、环境威力法则、内容附着力法则。本文将利用流行三要素的3个法则对微博信息传播的影响因素分别进行说明。1.1
关键人物影响因素
关键人物法则指出了这样的社会信息交流的事实:社会上绝大多数人构成的社会主体在进行决策时所依据的信
DOI:10.16353/jki.1000-7490.2014.03.011
情报理论与实践(ITA 欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟
息只来自于一小部分影响者组成的体,而这个影响者在社会网络中与其他人没有明显的等级差别,具体到信息传播,该法则指出有3类人在整个传播中起到关键性作用:内行(Mavens)、联系员(Connectors)和推销员(Sales-men),是他们发起并带动了整个传播过程:内行们相当于数据库,为大家提供信息;联系员是黏合剂,将信息传播到各处;推销员则负责“最后一公里”,说服人们接受该信息。在微博平台上,内行的作用得到了充分的体现———名人效应;而联系员对应微博的转发者,一条信息在被某个关键人物转发后,其传播速度和广度就会发生跳跃;微博评论者就相当于推销员,人们在考虑是否认真阅读甚至转发一条信息时,有时他人的意见是很重要的,这种从众的潜意识在某种程度上左右了人们的一部分信息传播行为,这也是很多微博谣言之所以能够借由推手策划得以迅速散播的原因之一。为了让微博被更多用户转发,就必须从微博发布者、转发者和评论者去入手,所以微博信息传播的关键人物影响因素应该包括用户的社会影响(粉丝数)、活跃度(发帖量)、微博被赞量、被评论量等。
1.2内容附着力影响因素
附着力法则阐述了被传播信息的本身特征。学界对信息附着力的研究,将其中最重要的要素概括为6个方面:简洁性、不可预期性、具体性、可信性、情绪性、叙事性。附着力的6个要素在我们阅读信息时都能深切体会到简短的信息更容易被认真阅读,爆炸性的新闻会引起强烈的关注,热点高频新闻词的出现更加吸引眼球,还有各种咆哮体、凡客体、淘宝体等,人们的信息接收行为被这6个因素强烈地引导,相关的调查研究也在实证上确认了这一点。在微博平台上,可以看到同一个用户的不同微博的转发量也有很大差异,可见微博的转发量是受到微博内容、主题、长度等因素的影响的。具体来说,微博信息传播的内容附着力影响因素应该包括微博主题、微博情绪彩、是否有“@”、是否包含多媒体信息、微博字数等。
1.3环境影响因素
根据环境因素的差异,环境威力法则可以分为“破窗理论”和“150法则”两部分,破窗理论指出人们习惯于从内在特征来解释事物,而忽略了具体情境所起的作用,但是人的行为是社会环境的作用,外部环境决定着我们的心态。如一些网站版面的设计中分享按钮的设置、信息呈现的形式都强烈地影响信息的传播特性。150法则则指出,人们在人中考虑得出的结论,往往与他们独自一人时得出的结论不相同,而且这个体存在一个极限数量———150。在微博类信息的阅读转发行为中,一些环境因素比较突出,如信息转发在一天中的固定时段、在一周的固定时段产生高峰。而且在微博发布后,其转发并不是一蹴而就,而是随时间的推移累积起来的。所以微博的转发量与微博的发布时间、发布日期和发布距今时间
有关。
2数据提取及分析
数据来源为新浪微博,由于研究的是微博信息传播的影响因素,且是用微博转发量来衡量微博传播程度,而普通微博的转发量大都为零、可利用性很低,所以抓取了名人用户的微博作为数据样本。数据提取是基于新浪微博自身的功能设计,在“风云人气榜”上随机抓取了300名用户的微博,由于用户粉丝数和微博发布距今时间对微博转发量有一定的影响,且从微博发布到抓取微博数据这段时间内用户所增加的粉丝数与微博转发量之间的关系尚不明确,因而数据抓取时间不能与微博发布时间间隔过长。数据抓取时间为2013年4月16日,采集了2013年4月8日到4月14日一个星期的数据,共4629条微博。
根据流行三要素理论的阐述,从原始数据中提取如下几个数据:微博发布人信息,包括发布人的粉丝数、关注人数、已发微博数;微博发布时间信息,包括微博发布的年、月、日、时、分、星期几、距4月16日的天数;微博基本信息,包括微博的转发数、评论数、赞数。
2.1回归分析
2.1.1研究变量
1)因变量:微博最大转发数(TransNum)。衡量一条微博的传播程度,其转发数无疑是最直接也是最
有说服力的考量。从采集的数据来看,转发数从几条到上万条不等,反映出微博信息传播程度的差距是显然可见的。本研究把用户一个星期内的最大转发量作为因变量,因为最大转发量体现了该用户所能达到的最大信息传播范围。
2)“关键人物”———发布者因素。发布微博人的社会影响(Fans):统计量是发布微博人的粉丝数。粉丝数是表征一个用户受关注程度以及其自身社会认知的最直接客观的变量。其代表了有可能转发此微博的用户数目,是考核转发数的基数变量,十分重要。
发布微博人的活跃程度(Act):统计量是发布微博人的已发帖量。用户的发帖频率会和转发数产生关系。
3)环境威力因素变量。发布微博的时间(WorkT和SleepT):将一天根据一般生活习惯分为3个区间段,工作时间9:00—12:00及13:30—17:00,空闲活动时间12:00—13:30及17:00到凌晨1:00,睡眠时间是1:00—9:00。因此设置3个虚拟变量[3]:WorkT、SleepT和PlayT,取1时代表处于工作时间段、睡眠时间段和空闲活动时间段,根据结果比较3个时间段的不同影响。
欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟实践研究
发布微博的日期(Weekend):对前面的一个修正,
因为在周末人们的活动并不严格受3个时段的限制,因此
加入一个虚拟变量Weekend表征是否发帖时间在周末
(周六和周日),取1时在周末。
发布微博距今时间(T):一条微博内容在某一时刻
的转发数应当与其自发出到该时刻的时间有关,以天数计
量T,代表微博发布时间到4月16号的天数。
基于对微博的了解以及一些文献的阅读,笔者做出预
期:粉丝数是微博热度的主要影响因素,而且与微博热度
有正的相关关系,用户粉丝越多,用户微博的热度越大;
用户的活跃程度对微博热度的影响不大,而且如果用户发
帖太频繁,一方面其可能获得的关注也越多,另一方面可
能其每一条微博受到的粉丝关注被分散,所以活跃度与微
博热度是正相关还是负相关无法预期;由于微博媒体具有
累积效应的特点,微博的发布时间对热度的影响不大;发
布微博距今时间与微博热度有正相关性。
2.1.2回归分析及结果出于样本量的限制,筛选了300
条最大转发量的微博,进行了如下的多元回归分析,由于
名人微博的粉丝数量过大,笔者对粉丝数进行了处理:
TransNum=a
1Fans
1000
+a
2
Act+b
1
WorkT+b
2
PlayT+
b 3Weekend+b
4
T(1)
回归结果如表1所示。表1中Pr是拒绝零假设的概率,Pr越小说明回归效果越好。
表1回归分析结果
(自)变量回归系数估计值标准误差t i Pr(t>t i)常数项1673.335463799.725500.440.6600
Fans0.831200.0819710.14<0.0001
T0.101940.07893  1.290.1975
Act-620.85092597.52736-1.040.2996 WorkT2643.477851562.64348  1.690.0918 SleepT-522.834942595.26433-0.200.8405 Weekend-3421.088722484.09566-1.380.1695 2.1.3结果解释上面的结果显示,拒绝零假设概率除了SleepT较大之外,其余的都比较小,说明数据回归的效果比较好。由结果数据可知:①微博用户粉丝数对转发数的影响较为显著,每增加1万个粉丝,微博就平均多转发8次左右。②微博发布距今时间对于转发数的影响不大,其影响方向是正的。③用户的活跃度对转发数的影响是负的,且数值较大。④发布微博的时间分布和星期分布对于转发数的影响并不显著,之所以系数显著,很可能是虚拟变量之下的假设检验系统性缺陷所导致。不过可以看出,相对于空闲活动时间来说,工作时间发布的微博转发数更高,睡眠时间发布的微博转发数更低。
2.2
单因素分析
以上多元回归实验的结果部分系数过于显著,且与笔者的预期有所差距,除了数据样本较小、虚拟变量之下的假设检验系统性缺陷等原因,笔者认为还与没有做各影响因素间的相关性分析有关,如粉丝数与微博发布距今时间就有一定的相关性,而多元回归分析中各因素之间应该是相互独立的,所以以上分析结果存在一定的误差。为了进一步研究各影响因素与转发数之间的关系,将逐一对粉丝数,发帖频率、发帖时间、发帖距今时间进行分析。
2.2.1微博热度与粉丝数为了避开其他影响因素的影响,进一步定量考察粉丝数与微博最大转发数的相关性,利用如下公式计算二者的相关关系:
R(i,j
)=
cov(i,j)
D(i
槡)D(j
槡)
(2)式中,i,j分别代表粉丝数和转达转发量两组数列,经计算得二者的相关系数R=0.5154,可见二者具有正的相关性,但这种相关性并不是非常强。这一点在图1中得到了直观的表现,拥有同样粉丝数的用户,其微博最大转发量却分布在个位数到上万条不等,拥有百万粉丝数的用户,其最大转发量也可能只有两位数。这在一定程度上说明粉丝数并不是微博热度的决定性条件。由于本研究的数据皆来自名人微博,故数据分布较为集中。
图1用户粉丝数与微博最大转发数的对数关系
2.2.2微博热度与发帖频率图2是发帖频率与平均转发数的对数关系,可以看出,图2中点的分布并不呈现规律性,可见二者的相关性很差,经计算其相关系数为0.0335,可见频繁发帖并不能增加微博热度,甚至可能因为发帖过于频繁,分散了粉丝的关注度或因刷屏导致部分微博未能引起关注,导致微博的转发量下降。
图2发帖频率与平均转发数的对数关系
2.2.3微博热度与发帖时间当一条微博在发布时能够被更多人看到,该微博流行的可能性就会增加,同样
情报理论与实践(ITA 欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟
300个名人用户的4629条微博为样本,来研究发帖时间对微博热度的影响。图3是采集每个时间段(间隔1h )发布的微博,并计算这些微博的平均转发量绘制的。图4是采集每个用户转发量前5的微博,共1500条微博信息,然后统计每个时间段(间隔1h )的微博数量,可以近似地把不同区间内微博的数量看做该时间段内微博的热度。两个图的结果是一致的,可以看出,一天中2:00—6:59之间的微博平均转发量是最低的,8:00以后微博的转发量均较高,8:00—10:00、11:00—13:00、18:00—19:00以及22:00—2:00是微博转发的高潮,在这些时间发布微博,更容易被转发
图3
微博发布时间与平均转发量
图4
微博发布时间与最大转发微博数量
图5
微博热度与距今时间关系图
2.2.4微博热度与发帖距今时间如果微博发布后,每
天都有粉丝转发,则同一用户发布的微博距今时间越长,其转发量应该越大。图5是采集300个用户每天发布的微
博,并计算每天微博的平均转发量绘制的。由图5可见,微博热度与发布距今时间并不呈现出任何关系,并没有距今时间越长,其转发量越大的现象。
发帖距今时间与微博热度不相关,这是由微博的转发规律决定的。张赛等通过对50条名人微博的转发过程跟踪,得出3种比较典型的微博转发随时间的变化规律
[4]
如图6 图8所示。可以很明显地看出微博转发过程中的特征因素:拐点和增长趋势。从增长趋势上看,热
门微博常以一种阶梯函数似的激增方式增长,经过一段很短时间的弧形拐点后达到潜伏状态或者衰亡。因此把热门微博的转发生命期粗略地分为潜伏期、激增期和衰亡期,如图6所示。潜伏期和衰亡期的划分依赖于是否存在二次增长,如图8所示,这种二次增长往往是由博主或者其他有影响力的用户转发造成的
图6
微博转发规律
A
图7
微博转发规律
B
图8
微博转发规律C
热门微博这种激烈而单一的增长方式说明:一条微博
欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟实践研究
要么快速受到关注,要么受到冷落,就此衰亡,或者等待新一轮的激增。也就是说,微博在发布后,如果没有衰亡,就会在1 3天的短时段内受到关注,转发量激增并达到极值。本文中的数据采集时间是2013年4月16日,此时采集的微博发布的时间都已经大于2天,基本上已经进入转发的衰亡期,随着时间的变化,转发量不再增长,于是距今时间与微博热度呈现出图5中的结果。当然并不是说线性增长在热门微博转发中不存在,例如在图7中出现了线性拐点,它出现在激增期结束之后,给微博转发带来了新的增益。但是50条微博中没有出现开始就呈线性增长趋势的微博,综合来看,微博的转发不呈现线性增长的规律。
3结果分析
回归分析结果表明:①微博用户粉丝数对转发数的影响较为显著,每增加1万个粉丝,微博就平均多转发8次左右。②微博发布距今时间对于转发数的影响不大,其影响方向是正的。③用户的活跃度对转发
数的影响是负的,且数值较大。④发布微博的时间分布对于转发数的影响并不显著。单因素分析结果表明:用户粉丝数与微博转发量之间有较强的相关性;用户活跃度与微博转发量不相关;微博的发布时间对微博的转发量有一定影响。
3.1关键人物的影响
3.1.1粉丝数的影响经过统计分析,微博用户的粉丝数是与微博信息传播关系最直接最显著的因素。这与我们日常的观察也很吻合,对于有成百上千万粉丝的用户而言,几乎每一条微博都有成千上万次的转发,而对于普通用户,其转发量往往是寥寥无几。其原因可以归纳为以下两点:①用户的粉丝大部分是喜爱或关心该用户的人,尤其是对于名人用户而言更是如此,因此粉丝数可以理解为大众对和该用户有关新闻的关心程度。②可以把粉丝体抽象为一个平台,每个用户都在自己的平台上发布微博,而粉丝数就是这个平台的大小。而且这种平台效应还会随着二次转发以指数的形式影响着信息的传递。
但是粉丝数并不是微博热度的决定性因素,我们会发现拥有成百上千万粉丝的用户,其微博最大转发量也可能是两位数甚至一位数。这是因为:①粉丝并不全是活跃用户,而且还有一部分是僵尸粉。②据调查显示,当发布一条微博,能够被粉丝看到的平均概率不到2%,也就是说假如有1万粉丝,也只有不到200人能够在第一时间看到,而会转发该微博的就更少了。
3.1.2发帖频率的影响用户发布的微博数量是一个历史累积统计,用以代表用户的活跃程度。越是活跃的
用户,其信息的形成越有经验,积累的关注度可能更高,但是在分析中其影响并不显著,主要原因在于:①粉丝数对微博转发量的影响比较大,其影响可能覆盖掉活跃度的影响,导致其影响没办法显现出来。普通用户的活跃程度与名人用户差异并不大,但是普遍来说,名人用户的转发量是比普通用户高很多的。②活跃程度对转发数在理论上存在一定的副作用,受众认真阅读或接受的消息是有限的,发布的信息过多可能使得用户的选择分散。而有的名人用户发布信息的频率很低,正是由于这种低频率,可能导致一旦发帖,粉丝大多会选择转发。
结合以上分析发现,较高的用户活跃度对微博热度可能有正的影响,只是由于受到粉丝数因素的影响,使其无法显现出来;过高的用户活跃度,对微博热度可能有负的影响,所以用户不能过于频繁地发帖。
3.2外部环境的影响
由于数据提取的限制,能够定量的外部环境只有时间相关的变量,主要是微博发布的时间段和微博转发的时间段。
3.2.1用户发帖时段的影响由前面的分析知道,一天中2:00—7:00之间发布的微博平均转发量是最低的,8:00以后微博的转发量均较高,8:00—10:00、11:00—13:00、18:00—19:00以及22:00—2:00是微博转发的高潮。主要是因为:①2:00—7:00是睡眠时间,在这个时段发布的微博数量很少,由于样本数量少可能存在统计误差,而且这时发布的微博不能第一时间被看到,而第二天早上又
很快被新发布的信息覆盖掉了。②8:00—10:00、11:00—13:00和18:00—19:00是处于上班前夕或下班前夕或刚下班的时段,如今上班族都有上班前打开电脑“刷刷微博”,下班前“刷刷微博”再关电脑的习惯,所以这些时段发布的微博容易被发现并转发。
③22:00—2:00是不同人的睡前时段,睡前刷刷微博已经成了当代人的习惯,所以在这个时段发布的微博也是容易被发现并转发的。
各个时段的微博转发量相差并不是特别大,可见发布时段对微博热度的影响并不是很显著,这与网络媒介的时延性是分不开的。半夜发出的微博并不意味着不会有转发,因为第二天它还是有机会出现在粉丝们的页面上。考虑到信息传递是不断有时延的,则具体的时间点对其传播特征不会有很显著的影响。这与传统的媒体是不同的,一则电视上的广告播出结束后就无法再与观众接触,但网络时代的信息却是不断累积或者说是膨胀的,其存储量与并发性惊人,因此时间的点效应有所消减。
3.2.2发帖距今时段的影响微博虽然是具有时延性的媒体平台,但同时其也具有更新速度快的特点,一条微博的新鲜度只有一两天的时间,即使是热门微博、热门话题

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。