我国足球归化运动员社会认同问题研究基于社交媒体内容的情感与主题分...
体育科学
我国足球归化运动员社会认同问题研究:基于社交媒体内容的
情感与主题分析
冷唐蒀1,艾伦·贝尔纳2,胡佳澍3,杨铄4*
(1.浙大宁波理工学院,浙江宁波315100;2.拉夫堡大学体育、运动与健康科学学院,英国拉夫堡;
3.上海体育学院,上海200438;
4.宁波大学体育学院,浙江宁波315211)
摘要:以新浪微博中“足球归化运动员”相关话题的文本内容为分析对象,通过基于人工标注的混合方法情感分析以及自然语言处理中的词频和关键词分析,对文本内容的情感极性、强度与主题等进行呈现与阐释,对我国足球归化运动员的社会认同问题给出以下判断:1)对归化运动员的社会认同在情感上呈现出两极分化趋势,负面情感的强度相比正面情感更为极端;2)公众对不同运动员的社会认同程度有较大的区别;3)随着时间的推移,公众对归化运动员的认同在情感上呈现出明显的“由负转正”;4)民族与血统、文化适应与融入以及竞技水平是公众讨论归化运动员时出现最多的3个主题。
关键词:足球归化运动员;社会认同;情感分析;主题分析
中图分类号:G80-05文献标识码:A
2018年以来,随着高水平足球运动员归化工作的全面开展,多位外籍足球运动员先后获得中国国籍,成为具有中国国家队出场资格的运动员。在这些足球归化运动员中,既有出生于其他国家、具有中国血缘关系的华裔运动员,也有长期效力中国俱乐部却无中国血统的外籍运动员。部分完成入籍手续的
运动员已经入选国家队,并在世界杯亚洲区预选赛等重要比赛中出场。在以社交媒体为代表的网络舆论空间里,公众在中国足球的语境中围绕归化运动员的国籍、血统、竞技表现、入籍程序、各方面的作用与影响等问题,展开了持续的讨论。新浪微博中,与归化运动员相关的多个话题引发了超过千万人的关注。
在此背景下,归化运动员的社会认同问题显然不再局限于体育领域,而是借助国家队这一体育竞赛载体产生广泛而多方面的影响。公众对归化运动员入籍以及代表国家队出场等事件是否支持、不同归化运动员获得的认同程度是否存在差异、公众对归化运动员的态度是否随时间推移而产生变化、围绕归化运动员的讨论聚焦的主题内容等,备受研究者关注。本研究基于社会认同理论以及体育社会学中与认同相关的研究,在收集与分析新浪微博中关于归化运动员若干话题讨论文本的基础上,通过基于人工标注与自然语言处理的混合分析方法,对文本内容的情感极性、情感强度以及主旨话题进行分析,进而对以上涉及我国归化运动员社会认同的若干问题给予解答。
1概念辨析与文献概述
1.1归化运动员
按照联合国国际移民组织(International Organization for Migration,IOM)的定义,出生后通过自愿申请并获得非出生时国籍的行为都可以被称为“归化”(naturaliza‐tion)。但IOM也指出,通过诸如血
缘关系或出生地等条件自动获得国籍时,即便本人曾经放弃国籍,日后再次申请获得时,也不会被纳入归化的定义。因此,严格意义上的归化运动员不包括有新入籍国家血缘关系的后裔运动员体,而仅包括成年后因工作或移居等,通过申请获得新国籍的运动员。
但在足球领域,根据现行的《国际足联章程》(FIFA Statutes)判断运动员是否具有代表新国籍国家参加国际正式比赛的身份时,除了必须具备该国的合法国籍外,还
文章编号:1000-677X(2021)02-0059-10DOI:10.16469/j.css.202102006
收稿日期:2020-08-21;修订日期:2020-12-02
基金项目:浙江省省属高校基本科研业务费项目(SJWY2021013)。
第一作者简介:冷唐蒀(1989-),女,讲师,博士,主要研究方向为话
语分析与跨文化研究,E-mail:*******************。
似的组词*通信作者简介:杨铄(1985-),男,副教授,博士,主要研究方向为体育
经济学,E-mail:**********************。
59
《体育科学》2021年(第41卷)第2期
需要根据运动员与新国籍国家在地缘、血缘、居住年限等方面的联系判断。如运动员是否出生于该国、三代以内直系血亲是否出生于该国、运动员是否在18岁以后在该国连续居住5年以上等(张鹏,2019)。本研究使用归化运动员的概念时,指涉对象除了成年后因工作等申请并入籍的运动员外,也包括与新国籍国家具有血缘及地理关联的入籍运动员。
1.2社会认同
1.2.1基本概念讨论
社会认同(social identity/social identification)研究多存在于社会学、心理学、哲学等领域。Tajfel(1982)从社会心理学角度,将社会认同定义为“一个人关于他(她)自身从属于某一个或多个社会体的自我认知,以及这种从属身份所带来的价值和情感上的意义”。基于这一定义,学者们认为,个体的社会认同主要由3方面构成:1)认知方面,即个体对具有某一社会体身份的自我分类;2)价值方面,即个体对这一社会体身份附带的正面或负面价值内涵的评估;3)情感方面,即个体对自己所属体的情感表达。公众在自我分类并获得体身份的基础上,会通过比较自己所属体与其他体,
形成内体偏好和外体偏见,并体现在价值评估和情感表达上(Ellemers et al.,1999)。随着认同研究的不断丰富,社会认同这一最初用来阐释际心理的概念,越来越多地与国家、民族、宗教、组织等概念相联系,并被用于分析一些更普遍的社会现象。学者们也更多地从社会规范、文化、关系等方面阐释社会认同。如我国社会学家郑杭生(1999)认为,社会认同是“个人和体对其身份和社会角的自我认定和他者认可”。可以看出,社会学视域下的社会认同研究,不再局限于关注个人对自我身份的感知,也对他人的客体评价给予同样程度的关注。
在体育社会学研究中,有学者指出,体育是构建各类社会认同的重要方式(Bairner,2001;Messner,1992)。无论是地区性质的体育俱乐部还是国家层面的运动代表队,其在社会认同方面的意义和价值都不仅限于运动员个人,还会关联到与这些运动员具有某些相同或相近身份的体。对我国公众来说,归化运动员在入籍之前是天然的外体,但在他们完成入籍手续之后,便拥有了合法的内体身份。在其入选甚至代表中国国家队出场之后,其身份不再仅限于普通的中国公民,更是成为一种“强有力的国家形象的象征”(Porter et al.,2013)。然而,这种身份特征的凸显,可能无法被体中所有个体接受,个体会通过各种渠道表达对归化运动员正面或负面的评价与情感。本研究在讨论归化运动员的社会认同问题时,从“他者认可”的角度切入,将社会认同视为体成员针对部分成员身份与角的情感表达,在此概念界定基础上,通过分析社交媒体上与归化运动员相关的讨论,阐
释情感表达的极性、强度以及具体内容,从而回答归化运动员社会认同相关问题。
1.2.2归化运动员社会认同问题研究概述
从研究主题来看,归化运动员认同问题从属体育移民运动员研究范畴。自20世纪90年代,随着体育赛事职业化和全球化程度的不断提升,体育劳动力的跨国迁移现象愈发频繁。如大量非洲运动员活跃在法国、比利时、葡萄牙等欧洲多个国家各级别的足球俱乐部中(Lanfranchi,1994)。在美国职业棒球、橄榄球和篮球等体育联盟中,也活跃着相当数量的亚洲、南美洲和欧洲国家高水平运动员。
伴随体育劳动力迁移现象的兴起,移民运动员的社会认同问题随之出现。以足球为例,有研究发现(Bromberg‐er,1994;Shor et al.,2010),在意大利、英国、以列等国家,高水平外籍运动员获得合法国籍后,关于其民族与身份的争论更加激烈,甚至引发抵制。总体来看,在大多数欧美国家,由于族的多样性、移民体的普遍性以及双重国籍的合法性,真正意义上的归化运动员数量极少,与移民运动员相关的社会认同问题大多是种族矛盾在运动场上的延续。
在民族同构性较高且不承认双重国籍的日本,归化运动员体引发了学界的关注。福岡安則(1993)区分了法律意义上的“日本人”和日本社会公众常识认知中的“日本人”之间的差异。将公众认知中的“日本人”解构为血统、文化、国籍3个要素条件的统一,只有3个要素全部本土化的“日本人”才是“纯正的”。其中,血统处于最重要的位置。在此基础上,千葉直樹等(1999)指出,部分归化运动员的生理特征与日本民众存在差异。此外,成长和受训地点在日本之外的运动员,未受日本文化的浸
染与熏陶,这些运动员会带来一种“体育文化的异质性”,从而导致“文化方面的违和感”,最终致使归化运动员的社会认同程度降低。
还有研究发现,日本公共舆论对归化运动员的认同程度并非一成不变。如代表日本出征世界杯的原巴西籍运动员吕比须·瓦格纳(呂比須ワグナー,原名Wagner Au‐gusto Lopes)得到日本主流媒体积极正面地报道。《朝日新闻》《读卖新闻》等媒体均聚焦于吕比须“得体的日语、谦虚的言行和吃苦耐劳的精神特质”(Chiba et al.,2001),认为吕比须“比日本人更像日本人”(千葉直樹,1999)。这些报道“给日本人带来一种错觉——拥有日本人的品格是吕比须被选为日本代表的原因”(千葉直樹,1999)。
归化运动员相关的一系列问题,已经引起我国体育学研究者的关注。有学者(徐伟康等,2019;张鹏,2019)从社会文化和法律依据的角度,探讨了中国足球归化运动员在规范性、可实现性和可操作性等方面的问题。也有学者(梁朱贵等,2020;张尧等,2020)对日本、卡塔尔、菲律宾等亚洲国家引入归化运动员的实践与影响进行阐释。总体而言,我国已有归化运动员相关研究主要集中
60
冷唐蒀,等:我国足球归化运动员社会认同问题研究:基于社交媒体内容的情感与主题分析
在法律政策和他国经验两个方面,鲜见从公众反馈的角度审视归化运动员社会认同问题的研究,对于“人们如何看待归化运动员”这一问题,无法给出准确的描述与判断。这是本文从社交媒体内容分析角度切入研究归化运动员社会认同问题的初衷。2研究方法
关于社会认同的早期研究中,研究者往往通过问卷测量个体对某一体的看法、观点和评价,来了解其社会认同的具体内容与强度,据此分析社会认同与其他行为之间的关系(Ellemers et al.,1999;Lam et al.,2010)。近年,随着社交媒体的发展与普及以及认同研究的社会学转向,国内外研究者开始通过分析社交媒体文本内容来阐释不同体的社会认同问题(杨桃莲,2017;Khajeheian ,2016;Sanderson et al.,2016)。在我国,以新浪微博为代表的社交媒体中产生了大量关于归化运动员的讨论,为
解析和阐释网络舆论中与归化运动员社会认同相关的问题提供了兼具即时性与历时性的语料。在参考已有研究方法的基础上,本文将新浪微博中与归化运动员相关热门话题下的讨论文本作为分析对象,通过基于人工标注的混合方法情感分析,给出用户在归化运动员相关人物或事件上表达出的情感极性与强度,运用自然语言处理中的词频分析、关键词分析等方法,进一步挖掘文本内容的主题,阐释具有代表性的高赞评论文本,从而对归化运动员社会认同问题给出若干判断。2.1文本采集
本研究首先通过百度指数数据对2018年11月至2020年1月涉及归化运动员的网页搜索指数进行基本分
析(图1)。对归化运动员相关网页的搜索发现,自2018年10月以来出现多次舆情高峰,在2019年9月中国队在世界杯亚洲区预选赛中战胜马尔代夫队后达到顶峰。舆情高峰主要集中在2019年2月、5—6月、8—9月3个时间段。
在初步了解舆论峰值变化基础上,研究进一步关注新浪微博中对归化运动员相关话题的讨论。在新浪微博的“话题检索”中以“归化”为关键词检索,共获得74个包含归化的话题,去除其中与足球无关的10个
话题后,对剩余64个话题的关注对象进行分类并按时间排序。结果显示,64个话题主要集中在“引入归化运动员”“侯永永成为中国首位归化运动员”“高拉特可能入籍”“李可成为首位进入国家队的归化运动员”“艾克森入籍后发表长篇博文”“艾克森代表国家队进球”6个事件上。基于每个话题的讨论和阅读数量,研究确定了2011年9月发布的归化运动员话题以及2019年2—9月期间5个与归化运动员具有高度关联性的话题(表1)。从讨论和阅读数量明显看到,归化运动员相关的话题热度在不断提升,到2019年5月“高拉特入籍”时达到关注度的顶峰后开始下降,整个舆论热度的变化与百度指数呈现的趋
势相符。
从新浪微博内容结构来看,每个话题下会有多条博文(用“#”来关联话题),用户可以赞同或评论博文。从内容来看,博文多为陈述性的新闻报道,不具有情感倾向,
图1
归化运动员百度指数
Figure 1.
Baidu Index of Naturalized Footballers
注:资料来源于http ://index.baidu 。
表1本研究选取的6个微博话题基本情况Table 1
Metadata of the Selected Six Weibo
Topics
归化运动员
中国首位归化运动员侯永永
高拉特入籍
李可将成为首位归化国脚
艾克森发长文艾克森国足首球
2011/09/162019/02/132019/05/272019/05/282019/08/222019/09/11
19981023240004120556911000
403.5785.02700.07172.98080.85499.2
注:数据来源于新浪微博,数据时间截至2020年3月1日。
61
《体育科学》2021年(第41卷)第2期
能反映公众的态度。针对该主题的讨论主要集中在博文下的评论中,尤其是热门博文获得大量赞同的评论内容,能够很好地反映公众对某一特定博文内容的情感与态度。在以微博评论文本为分析对象的研究中,抓取海量数据和选取典型评论的方法都较为常见。本研究综合两类方法,按照新浪微博的官方排序对热门博文进行首轮抓取,获得热门博文的内容、发布者、赞同和评论数等。从累积分布来看,排名前10的热门博文获得的赞同和评论总数占到同一主题下所有博文赞同和评论总数的90%以上。据此,研究选取每个话题下点赞最多和评论最多的10条热门博文(表2),剔除重复博文后,对每条博文下的评论文本进行二次抓取,共获得超过2万条评论。大多评论没有获得赞同或进一步回复,研究剔除所有未获得赞同和回复的评论,得到各话题下有效评论共1788条,总计获得63502个赞同。在此基础上,通过基于人工标注的混合方法,对文本内容进行情感分析。
2.2基于人工标注的混合方法情感分析
语言学研究中,情感通常是指通过语言(文本)表达的正面或(Taboada,2016)。情感分析通常包括4种类型:极性分析、强度分析、情绪分析和主观性分析。其中,极性分析关注态度的正负,强度分析探讨递进层级,情绪分析偏重情感分类,主观性分析则揭露偏见(Vij et al.,2018)。根据研究目的以及对社会认同概念的界定,本文选择极性分析和强度分析来探究社交媒体相关讨论中的情感态度和递进层级,呈现公众对归化运动员的认同情况。
目前,通用的极性和强度情感分析方法主要包括计算机检测和人工标注2个类别。前者主要用于处理海量的新闻报道、文学作品等文本数据,一般采取基于情感词典的自然语言处理方法,但该方法在分析社交媒体内容时面临两个难题:1)网络用语含有大量缩略词、行话、对已有内容或概念的指涉等,相较其他类型的文本语言更复杂(Sánchez-Rada et al.,2019),而计算机检测依赖的中文情感词典尚未完全覆盖以上内容(赵蓉英等,2018)。如
续表2
话题李可将成为首位归化国脚编号
1
2
3
4
5
6
7
8
9
10
11
12
评论数
1617
343
74
69
18
12
11
10
8
8
7
1
点赞数
2282
268
294
173
29
21
16
2
38
5
66
13
话题
编号
1
2
3
4
5
6
7
8
9
10
11
12
评论数
6504
326
555
105
214
133
50
252
145
130
3
135
点赞数
52853
1015
2791
463
1157
893
484
931
436
427
595
9
话题
编号
1
2
3
4
5
6
7
8
9
10
11
评论数
1765
1537
1536
355
351
251
213
122
119
80
点赞数
12165
11421
66520
2451
1489
1627
612
1275
704
116
7054表2本研究选取的6个话题中回复与赞同数排名前10的博文(去除重复)
Table2Top10with Replies and Approvals among the Selected Six Topics
话题归化运动员编号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
评论数
251
68
52
47
36
34
26
24
19
15
12
9
6
点赞数
57
20
102
25
67
109
4
10
3
10
51
36
17
18
话题
编号
1
2
3
4
5
6
7
8
9
10
11
12
13
评论数
1087
11
8
5
5
2
2
1
老婆对老公说父亲节的祝福语
1
点赞数
2323
20
17
4
1
2
1
20
3
2
话题
编号
1
2
3
4
5
6
7
8
9
10
11
绿豆糖水12
13
评论数
4734
2190
1638
638
525
374
341
308
303
280
202
142
99
点赞数
7729
22812
1420
215
881
1172
141
103
1849
93
230
食材_秋葵窍门6012
250
62
冷唐蒀,等:我国足球归化运动员社会认同问题研究:基于社交媒体内容的情感与主题分析本研究涉及文本中多次出现的“小熊”(艾克森的昵称)、
“三叉戟”(足球三前锋阵型的通俗说法)等,目前的各类
中文情感词典都无法准确辨识其情感属性。2)一些文本
尽管不包含计算机难以识别的词汇,但其(亚)文化背景
难以被准确解读。以本研究中“人口数量44万”和“兄弟
妹是一家”2条获得高赞的评论为例,“人口数量44万”
是指国足比赛对手马尔代夫的国内人口数量;而“兄弟
妹是一家”,结合归化运动员艾克森代表国家队在世界杯
预选赛进球的事实,以及“兄弟妹是一家”的表述,可以
判断出该回复意味着对归化运动员的接纳。这类文本的
情感属性需要通过人工标注的方式才能准确识别。
据此,本文采用基于人工标注的混合分析方法进行
情感分析。一方面,由2名编码者(本文第一作者和通信
作者)协同编纂编码书,并在计算编码者间信度的基础上
对编码结果进行赋值与统计,观察情感极性与强度的分
布状况;另一方面,在情感分析的基础上,通过自然语言
处理方法分析词频及关键词,对文本进行主题归纳,并阐
释部分获得高赞同的评论,讨论情感表达指向的具体
内容。
2.3编码书与编码者间信度
参考Bernard等(2010)的模板,本研究者合作制定编
码规则并撰写编码书(表3)。根据文本语义和符号特征
(Liu,2015),本研究将文本的情感态度和递进层级分为
强烈赞同、赞同、中立或未表态、反对、强烈反对、无关或无法判断6个类别。其中,无关或无法判断类别中主要是一些关于其他运动员、比赛或事件的评论等,或完全以无意义的标点符号等为内容的评论。此外,根据情感的正负及强弱,对前5个类别的评论分别赋值为2、1、0、-1、-2。根据编码书,两位编码者选取“艾克森国足首球”话题下的259条评论,分别对博文进行独立编码,并通过SPSS 19.0软件计算Krippendorff’s Alpha(KALPHA)值检验编码者间信度。经过检验,两位编码者独立编码结果的KALPHA值为0.846,说明编码者间信度较高且编码书的内容具有可靠性(Krippendorff,2004)。在此基础上,由一位编码者完成全部1788条有效评论的编码。
3结果与讨论
3.1情感分析结果与讨论
根据编码结果,在1788条有效评论中,有462条与话题无关,不作为情感分析的目标文本,其余1326条评论聚集在不同的情感区间。在各个话题下的有效评论以及与话题相关评论的数量(表4)中,公众关注度最高的“艾克森发文”和“高拉特入籍”两个话题下,有效评论和与话题有关评论的数量也是最多的;在2011年便出现的“归化运动员”话题,以及围绕知名度和影响力较低的运动员侯永永和李可的话题,得到的关注与讨论相对较少。
通过各个话题下所有与话题相关的有效评论的编码结果(图2)可以看出,不同话题下评论的情感极性与强度存在显著的区别。从情感极性来看,前4个话题中呈现负面情感的评论占据较高比例,尤其是在“高拉特入籍”的话题下,负面情感评论(包括赋值为-2和-1的评论)的比例达到58.6%,而在“艾克森发文”和“艾克森国足首球”2个话题下,包含正面情感内容的评论比例分别达到83.6%和75.0%(包括赋值为2和1的评论)。
从话题涉及的运动员来看,在将归化运动员作为整体讨论的“归化运动员”话题中,公众的情感表达以居多,而具体到运动员个体时,情感倾向发生分化。针对侯永永的博文以中立或未表态的评论为主,有一些表达支持的声音,但比重不及反对意见,也不存在强烈支持的评价。相比之下,同样具有一半中国血统的运动员李可面临的争议则较大,除了参与讨论的人数更多外,表达支持、强烈支持以及强烈反对的评论,都占据相当的比重。艾克森和高拉特作为专业能力较强、没有中国血统的巴西裔归化运动员,在公众中的社会认同程度存在显著的差异。高拉特的情感倾向聚集在偏负面的区间,
艾克森则获得了较高的支持。从情感强度来看,“高拉特入籍”话题下强烈反对(赋值为-2)的评论数量和比例是所有话题中最高的,“艾克森发文”话题下强烈赞同(赋值为2)的评论数量和比例是所有话题中最高的。
表3本研究采用的编码书
Table3The Coding Book Used in the Research
编码名称
强烈赞同
赞同
中立或未
表态
反对
强烈反对
赋值
2
1
-1
-2
完整描述
行文中含有
正面情感词
且没有负面
情感词;直接
或间接支持
归化运动员
的评论
表示一般支
持的评论
2023年父亲节是哪一天
既不支持也
不反对或未
表态的评论
表示一般反
对的评论
行文中含有
负面情感词
归化和入籍的区别
且没有正面
情感词;直接
或间接拒绝
归化运动员
的评论
编码条件
与话题有关,出现
亲缘称呼、归化运
动员昵称;“支持”
和“加油”等表达
赞同的动词前出
现表示程度高的
副词;出现表示强
调的标点符号
与话题有关,包含
针对归化运动员
的正面评价且没
有负面情感词
与话题有关,但不
含正和
情感词
与话题有关,包含
且没有
正面情感词
与话题有关,出现
“不支持”和“反
对”等动词前出现
表示程度高的副
词;出现表示强调
的标点符号
排除条件
未出现符合
编码条件的
表达
出现符合其
他编码条件
的表达
有明显情感
倾向
出现符合其
他编码条件
的表达
未出现符合
编码条件的
表达
63

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。