基于网络文本分析的旅游目的地形象感知研究
基于网络文本分析的旅游目的地形象感知研究
作者:陈敏艳 夏鑫
来源:《商情》2020年第04期
        【摘要】当今世界互联网高速发展,网络游记影响着目的地形象的塑造,本文以日本为研究对象,基于马蜂窝的1980篇游记为研究内容,通过网络文本分析游客对日本的形象感知,结果发现:(1)游客对日本的感知是以“日本”为核心,以基础设施为重点的圈层式扩散结构特征;(2)游客对日本的情绪以正向情感为主,但其中也存在不少负面情感,主要包括配套设施、旅游吸引物和主客互动三方面。并据此对目的地营销组织提出相关建议。
        【关键词】日本旅游形象马蜂窝游记
        1.引言
        随着网络技术的更新换代,我国已逐渐进入全民互联网时代,互联网走入更多家庭,并更为国民所接受。互联网与传统旅游业的深度融合发展已成为不可阻挡的时代潮流,越来越多的网民更加依赖网络信息,通过互联网了解世界。网络平台成为旅游者出游前获取旅游目的地形
象最容易、最快捷的途径,游客往往会倾向于查阅相关游记、评论来感知旅游地。互联网的到来在改善和丰富旅游者的旅游体验之时,也产生了旅游者记录的大量不同类型的旅游数据,这也为研究者提供了网络研究素材,减少了传统问卷和访谈因问卷数量、调查者的动机以及调查问卷设计等因素产生的数据质量问题。时代的变迁和科技技术的高速发展,使得来越多研究者认可通过网络文本研究旅游形象的价值。
网络安全短句        日本是中国一衣带水的邻邦国家,据日本旅游局统计数据显示,2018年中国去日本游客数超800万,让人不禁好奇,日本因何能将旅游业做的如此发达?因此本文根据游客对日本游记的高频特征词及情感整理分析,从而深入分析游客对日本的整体感知,以期为未来其他国家的旅游营销策略提供现实指向。
        2.研究设计
        2.1样本选取与处理
        在互联网迅速发展的今天,在线旅游企业发挥中越来越重要的作用,不仅为后端旅游商提供了精准的流量,也可以帮助更多前端的用户做出消费决策。因此本文选择国内影响力较
大的马蜂窝网站作为本研究的样本来源。在马蜂窝的搜索栏中输入“日本”,选择游记选项,利用火车头采集器,对所需游记文本进行抓取,共抓取2051篇。在獲得相关游记之后进行人工再次筛选,最终确定游记1980篇。
        2.2关键词分析
        (1)高频特征词分析
        一般来说,旅游者经常提到的某些词语是该旅游目的地给游客留下的深刻印象,能够为游客带来记忆,词频出现的越高,说明该词给旅游者留下的印象越深,这有助于我们了解旅游者对该目的地的整体印象。由于通过评论获得的文本信息十分冗杂,首先将所有游客的游记文本整理到一起,然后利用Jieba分词工具和自定义词典将评论的文本数据进行分词分词和词频分析,得到前50位高频词排序如表1所示。
        如表1所示,在搜集整理后的网络文本中排名前50的词汇中,从属性来看包括名词、动词、形容词三种词性。其中名词主要是日本对的旅游形象标签,涵盖城市名称(大阪、京都、东京等)、景区景点(心斋桥、富士山、环球影城等)、旅游基础设施(酒店、机场、交通等);动词主要是描述旅游者的行为,如选择、购物、预约等;形容词主要是表现旅游者对旅游资源和旅游设施的评价,如便宜、免费、好吃等。
        (2)高频词语义网络分析
        为了探究各高频词之间的关联度,对其进行共现分析,在语义网络图中,可以根据线条的疏密程度判断共现频率的高低,线条越密集,共现频率越高,两者的关系也越密切,本文引入ROST CM6文本挖掘软件对马蜂窝日本游记进行语义网络高频词分析。日本游记语义网络关系图由多组节点和弧线构成,其中节点代表日本旅游形象的组成要素,弧线的错综复杂程度表现出两者之间的关联程度,高频特征词的语义网络关系构建如图1。
        由语义网络关系图可知,日本游记呈现出“核心--边缘”层级式扩散特点。(1)核心层以“日本”、为中心呈圈状分布,其周围扩散着的“便宜”、“购买”等词;(2)边缘层由“大阪”、“日元”、“东京”、“地铁”等日本基础设施和特殊属性元素等组成;(3)外围散布着“预定
”、“乘坐”、“服务”、“路线”、“工作人员”等旅游基础要素。语义网络关系图大体上反映出游客对日本的感知是以“日本”为核心,以基础设施为重点的圈层式扩散结构特征。
        2.3旅游者情感分析
        本文采用Python编程对特征情感词对进行情感分析,程序包括读取数据文件、分词、词性标注等过程,再利用正则表达式抽取短句,加载所构建的各类词典,出文档中的情感词、否定词以及程度副词,然后判断每个情感词之前是否有否定词及程度副词,将它之前的否定词和程度副词划分为一个组,如果有否定词将情感词的情感权值乘以-1,如果有程度副词就乘以程度副词的程度值,最后所有组的得分加起来,大于0的归于正向,小于0的归于负向。最后得到的总情感分布表如表2所示:
        利用python对文档进行分句,共计得到79906个句子,其中积极情绪55021条,占比68.86%;消极情绪12619条,占比15.79%;中性情绪12238条,占比15.32%,旅游者对日本的情感认知中以积极正面情感为主,且感情强烈;旅游者对日本表现出了少数消极负面情感,说明有游客的体验未达到他们的期望,因此应该重视消极因素,从而进一步提升游客体验。
        图中显示的词语是经过情感分析之后提取出来的情感词,分为积极情感词和消极情感词。从图中可以看出,消极的情感词主要围绕在排长队、公交复杂、交通贵以及出现问题等几个方面,积极的情感词主要围绕在口味好、价格实惠、方便、便宜等方面。我们可以看出,日本今后可以在解决排队问题和交通问题等方面做出更多的努力;同时自己原有的饮食口味、便利性等方面也需要继续保持。
        相比于游客的积极情感,消极情感往往更值得关注,这些不足能直接影响游客的满意度和重游率,因此,本文将游客的消极情绪进行编码,最终获得3个核心属类,7个二级分类,如表3所示。
        4研究总结
        4.1研究结论
        本研究通過挖掘马蜂窝日本游记这一网络文本,通过提取高频特征词,构建共现词组的语义网络关系图,来分析日本游记高频关键词中的相互联系,发现游客对日本的感知是以“日
本”为核心,以基础设施为重点的圈层式扩散结构特征;然后通过计算网络文本的情感值发现游客对日本的情绪以正向情感为主,但其中也存在不少负面情感,主要包括配套设施、旅游吸引物和主客互动三方面,需要目的地营销组织多加关注。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。