-
开放科学(资源服务)标志码(OSID):
-
随着互联网技术的高速发展,旅游者越来越倾向于利用互联网进行旅游产品预订、点评、社交等活动,在各类平台产生了海量的数据. 其中,游客点评或评论数据是一类非结构化的文本数据,在各类社交网络中大量产生和存储. 文本评论数据具有非结构化、碎片化的特征,是游客经过思考和语言组织表达的思维内容,情感比较稳定,文本中包含了游客对旅游目的地的情感倾向,而情感倾向表达了游客的旅游体验感知[1].
对游客情感倾向的提取和分析有助于发现游客感知的旅游目的地形象维度和具体影响因素[1]. 情感倾向的特定维度,例如拥挤感知存在显著的地理差异[2],游客的情感特征与时间地理学相关[3]. 文本评论的情感倾向亦是了解旅游者游后行为意图[4]的高效来源.
评论文本数据的情感倾向提取方法目前以基于情感词典的方法[5-7]、基于机器学习和大数据的方法[8-14]为主. 基于情感词典的方法准确率受到词典颗粒度和学科分类准确性的高度影响[15],但应用简单;基于机器学习和大数据的方法在监督学习后可获得较高的准确率和效率,但需要以大量的人工标注训练集为基础.
2021年“五一”小长假期间,国内旅游人次达2.3亿,按可比口径恢复至疫前同期的103.2%,实现国内旅游收入1 132.3亿元,其中32%的游客采用了互联网预订等方式(新华网http://www.xinhuanet.com/2021-05/05/c_1127410778.htm),成都、重庆等城市成为热门旅游目的地,游客量分别超过390万和280万(中国互联网资讯网http://www.199it.com/archives/1242394.html). 游客量的增加带来了高旅游收入,但同时也可能引起旅游体验的波动,对网络评论文本情感倾向的地理差异及其特征分析有助于发现游客情感的时空变化[16],可为旅游目的地理解旅游者行为产生重要的决策支持[3],并可发现各类因素对游客情感的影响[11],了解游客感知的目的地形象[17],判断游客忠诚度的影响因素和作用机制[18].
本文选取成都和重庆为研究目的地,以2021年“五一”期间新浪微博评论文本为研究对象,结合情感词典和机器学习的方法对评论文本进行情感标注和打分,对情感评分结果进行定量分析,同时对评论文本进行定性分析,以探求游客情感倾向的地理差异及特征,明确影响因素.
Geographical Differences and Characteristics of Tourists' Emotional Tendency
-
摘要: 通过对2021年“五一”期间去往成都和重庆的游客在微博上发布的评论文本进行定量和定性分析, 发现两地游客好评率均大于50%, 好评率空间自相关性表现不显著, 但好评率次高值[50%~75%)客源地呈现出明显的空间集聚特征, 以华中和华南各省(自治区)为主. 成都和重庆的高值和低值范围地理差异显著, 且均无空间集聚特征. 两地旅游主体在积极情感文本符码中均包含多人群体和单体, 消极情感文本符码中则均为单体. 成都和重庆的游客旅游目的有较大差异, 成都游客以美食和观光为主; 重庆游客则以观光、粉丝和情感为主, 重庆游客的旅游目的更多元. 成都游客对成都的饮食和风景高度认可, 部分景点的高知名度引发的拥挤、部分城市基础设施的损坏及天气炎热是成都消极情感的主要来源. 重庆的城市形象“浪漫”输出比较成功, 是旅游主体多为群体的主要原因之一, 粉丝营销效果明显, 吸引了大量明星的粉丝; 重庆的消极情感集中表达在天气热、人多和爬坡产生的疲劳等方面, 在消极文本中城市形象感知表达为中性.Abstract: Through the quantitative and qualitative analysis of the comments posted on Weibo by tourists to Chengdu and Chongqing during May 1, 2021, it was found that the positive feedback rate of tourists in both places was greater than 50%, and the spatial autocorrelation of the positive feedback rate was not significant, but the second highest value of positive feedback [50%-75%) of tourism-generating region showed obvious spatial clustering characteristics mainly in the provinces and cities of central and southern China. Chengdu and Chongqing had significant geographical differences in the range of high and low values, and no spatial clustering characteristics. The tourism subjects in both places contained multi-person groups and individuals in the positive emotion text code, while only individualswere in the negative emotion text code. There were significant differences in the tourism purposes of tourists in Chengdu and Chongqing. Tourists in Chengdu were mainly for food and sightseeing, and in Chongqing were mainly for sightseeing, fans and emotions. Chongqing tourists had more diversified tourism purposes. Chengdu tourists highly recognized Chengdu's food and scenery, and crowding caused by the high popularity of some attractions, some damaged urban infrastructure and the hot weather were the main sources of negative emotions in Chengdu. Output of Chongqing's city image "romantic" wasvery successful, which was one of the main reasons why the majority of tourism subject was the multi-person groups. The fan marketing effect wassignificant, attracting a large number of fans of celebrities. Chongqing's negative emotions were mainly expressed to the hot weather, people and fatigue of climbing the slope. The perceived expression of the city image in the negative text was neutral.
-
Key words:
- emotional orientation /
- geographical differences /
- characteristics /
- Weibo .
-
表 1 成都、重庆情感倾向
省(自治区、直辖市) 成都情感得分均值 成都离散系数 成都好评率 重庆情感得分均值 重庆离散系数 重庆好评率 黑龙江 1.40 1.47 0.56 0.00 0.00 -1.43 新疆 4.00 1.39 -0.24 4.50 0.43 1.70 山西 2.20 1.16 0.56 0.84 1.55 0.22 山东 0.47 2.64 -0.41 3.96 1.12 0.20 河南 1.60 1.56 0.56 2.46 1.38 0.77 江苏 0.67 2.89 -1.23 2.74 1.30 -0.04 安徽 4.00 0.00 2.61 5.09 0.68 0.84 湖北 1.73 1.48 0.22 1.91 0.93 1.34 浙江 2.00 1.84 0.33 0.03 39.19 -0.78 江西 1.38 1.45 1.33 2.45 1.40 0.84 湖南 2.27 1.27 0.28 1.85 1.34 0.31 云南 1.33 1.41 -0.81 -0.71 -0.63 -1.43 贵州 0.73 1.95 -0.65 -0.69 -2.91 -1.19 福建 0.33 2.24 -1.66 4.05 0.74 1.27 广西 1.00 1.51 0.41 0.00 0.00 -1.43 广东 0.83 2.66 -0.84 2.40 1.45 0.19 海南 4.20 1.43 0.56 2.50 0.54 1.38 吉林 1.00 1.41 -0.81 -1.00 0.00 -1.43 辽宁 0.67 1.41 -0.81 0.00 0.00 0.00 天津 3.00 1.43 -0.47 2.00 0.00 1.70 青海 5.00 0.32 2.61 0.00 0.00 -1.43 甘肃 0.87 3.00 -1.49 0.25 4.36 -0.65 陕西 1.14 2.09 -0.30 1.46 2.12 -0.53 内蒙古 1.10 2.21 0.05 0.00 0.00 0.00 重庆 2.07 1.42 0.13 2.50 1.43 0.37 河北 0.45 2.37 -1.12 0.73 1.56 -0.43 上海 2.64 1.78 0.35 1.79 3.03 -0.07 北京 1.41 1.88 -0.33 2.02 1.47 0.28 四川 1.86 5.07 0.63 0.50 3.96 -0.59 *注:表1中不含港澳台和西藏、宁夏的数据,其中西藏、宁夏评论数据爬取量为0. 表 2 成都积极情感文本编码
开放式符码 亚类属 主类属 锦里(4);三圣玫瑰谷(6);三圣乡(10);三圣乡红砂村(4);墨石公园(10);稻城(7);鱼子西(4);天府芙蓉园(10);普照寺(6);锦江(7) 景点(68) 目的地(16.6%) 汉室酒店(4);咖啡馆餐厅(2);饕林(2);四川锦江宾馆(5) 微观点(13) 朋友(12);小孩(3);大家(3);我(27) 参与主体(45) 旅游主体(9.2%) 肥肠粉(8);人民公园钟水饺(2);叶婆婆钵钵鸡(10);玫瑰糍粑(2);抄手(3);糍粑(2);火锅(5);云吞(10);花椒冰淇淋(6);烤鱼(10);老妈蹄花(4);甜皮鸭(10);烤猪蹄(2);苕皮豆皮(8);冰汤圆(4);冰粉(3);豆腐脑(6) 美食(95) 旅游目的(21.1%) 拍照打卡(4) 观光(4) 禅修(4) 减压(4) 古色古香/古风(3);汉室风格(2);一户一景/全新景象(2);;漂亮/美丽(12);鹭鸟/水鸟(4);店长太漂亮(4);人气火爆/好多人(6);多次去过(8) 视觉感知(41) 客观感知(24.6%) 天气热(9) 体觉感知(9) 不黑暗(3);烟火气(4);落落大方(2);温婉雅致(5);像杭州(5);似江南(7);非常小资有情调(2);价值八百万(3);古董床(3) 形象感知(34) 3天2夜(1);傍晚/晚上(7);节假日(7);零点后(7);清晨/早上(11);10分钟车程(3) 时间感知(36) 遗憾(4);超级棒/非常棒(13);喜欢/好喜欢(16);出乎意料(4);舒坦(6);便宜(3);开心/快乐/欢喜(21);轻松好玩(4);平静(10);小激动(9);下次还去(8) 情感体验(98) 主观体验(28.5%) 很高档(8);太惊艳了(9) 氛围体验(17) 好吃(14);清爽的口感(4);口感很棒(3) 味觉体验(21) 服务绝对一流(2) 服务体验(2) 注:表2中( )内数字为符码出现频次;主类属( )内数字为百分比. 下同. 表 3 成都消极情感文本编码
开放式符码 亚类属 主类属 天座商场(2);顺城大街(2);武侯祠(3);宽窄巷子(12);九眼桥(9);大熊猫繁育研究基地(5);龙泉(4);中华地下商业第一街(9) 景点(46) 目的地(15.6%) 我(17) 参与主体(17) 旅游主体(5.8%) 吃吃喝喝(5);刨冰(6) 美食(11) 旅游目的(4.8%) 挣钱(1) 商务(1) 打个的/坐车(2) 交通(2) 人太多了/人挤人(34);排队/排了特长的队(17) 视觉感知(51) 客观感知(54.4%) 热疯了/又热又挤/格外热/又晒又热/热到睡不着(67);风太恐怖了(3) 体觉感知(70) 机器坏了(5);荒废(8);打车超级难打(4);城市改造(4);关门歇业(5) 形象感知(26) 7天假(4);半夜(3);上午/中午(6) 时间感知(13) 没有后来(7);丢了(2);懒的要死(8);下降(8);累得够呛(9);心情糟糕(14);绝不出来玩(6) 情感体验(54) 主观体验(19.4%) 傻子设计(3) 服务体验(3) 表 4 重庆积极情感文本编码
开放式符码 亚类属 主类属 涂鸦街(2);李子坝轻轨(8);南滨路(4);嘉陵江(9);长江国际(1);渝中区(4);磁器口(6);解放碑(3);新巴渝十二景(6);洪崖洞(8);千厮门大桥(9);海棠溪筒子楼(6) 景点(66) 目的地(11.6%) 中古餐厅(6);宝藏吃冰地(2) 微观点(8) 小伙伴/伙伴(11);好朋友(8);我(7) 参与主体(26) 旅游主体(4.1%) 日式刨冰(4) 美食(4) 旅游目的(13.5%) 何平(4);央视(11);青年艺术家(5);拳击冠军(7);追星(3);肖战(12) 粉丝(42) 遇到(10);喜欢的人(10);喜欢的男孩(5) 情感(25) 打卡拍照/拍照打卡(15) 观光(15) 轨道(13);摩的(9);帅哥美女遍布街边(9);人头攒动(14);灯火辉煌(7);赛博朋克(5);堵车(4);帮我们指路(3);提前结束打表器(3);本人超美(10);装修海边气息(5);风格偏日式(7);超五星室内装修(11);门口板凳上乘凉的大妈下棋的大爷(1);颜值超高(10);夜空星光璀璨(2);高低起伏(7);城门九开八闭(8);分不清1F/不知几楼(5);紧凑(6);江河纵横(3);群山环绕(4);魔幻建筑(4) 视觉感知(150) 客观感知(52.2%) 有点火辣炎热(7);最高温度35度(3);食物风格十分熟悉(5);南方口音(8);讲话很温柔(5) 体觉感知(28) 热情好客(5);耿直爽快(4);庆幸的庆(3);极具人气(7);享有美誉(6);重逢的重(11);实力宠游客(12);魔幻都市(11);人热情(7);最宠粉的城市(11);出租车司机也很好(9);山城(6);人超好(10);超级适合拍照(2);中国的西南(10);火锅热力冲天(9);从开始到未来(3);特殊的地理环境(6);独特范本(4);无法格式化(3);包容性强(6);奇妙复杂的城市(9) 形象感知(154) 疯狂安利(9);真棒(8);喜欢/非常喜欢(13);一定要去(3);来了就不想走(6);治愈(7);高级(2);爱到不想离开(11);嗨到头晕目眩(2);可可爱爱(6);沉浸其中(11);太棒啦(10);震撼(5) 情感体验(93) 主观体验(18.6%) 味道一级棒/味道棒(11) 味觉体验(11) 网红(4);热闹非凡(3);物美价廉(7) 氛围体验(14) 表 5 重庆消极情感文本编码
开放式符码 亚类属 主类属 双碑大桥(2);索道(2);白象街(3);李子坝(2);解放碑(8);白象居(3);洪崖洞(10);袁家岗(5) 景点(35) 目的地(9.2%) 我(13) 参与主体(13) 旅游主体(3.4%) 干饭(3) 美食(3) 旅游目的(4.5%) 隐秘的角落(3) 粉丝(3) 打卡(4);出片率(7) 观光(11) 堵(10);人挤人/排队/人多(31);等了快4个小时(7) 视觉感知(48) 客观感知(63.1%) 热/超过34度(59);下雨(2);风大(4);爬坡/上坎/爬楼(26);步行(4);8D山城街道(7) 体觉感知(102) 巴渝风情(3);油屋(4);光怪陆离(5);吊脚楼(4);二次元(8);千与千寻(3);梦幻绚丽灯光(3);空中楼阁(5);生活气息浓重(3);弥漫火锅味(7);起伏(10);山城(9);有水有美食(7);烟火气息(6);叫你妹儿嘞(3);魔幻(4);5D城市(7) 形象感知(91) 晕晕乎乎(2);刺激(2);累到不行/脚废了(13);再也不来赶挤/人少再来(11);再也不要(10);暴躁(2);深度游(4) 情感体验(44) 主观体验(19.8%) 微辣/火辣/超辣(17) 味觉体验(17) 没有坐上(9);爬不了20层楼/爬不动楼(6) 氛围体验(15) -
[1] 刘逸, 陈欣诺, 保继刚, 等. 游客对自然和人文旅游资源的情感画像差异研究[J]. 旅游学刊, 2019, 34(10): 21-31. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-LYXK201910007.htm [2] 程云, 殷杰. 游客拥挤的生成、差异与影响: 综述与展望[J]. 地理与地理信息科学, 2021, 37(2): 121-127. doi: 10.3969/j.issn.1672-0504.2021.02.017 [3] 丛丽, 何继红. 野生动物旅游景区游客情感特征研究——以长隆野生动物世界为例[J]. 旅游学刊, 2020, 35(2): 53-64. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-LYXK202002012.htm [4] 蒋怡斌, 张红, 张春晖, 等. 影视旅游者真实性感知、怀旧情感和地方依恋对行为意图的影响——以西安白鹿原影视城为例[J]. 浙江大学学报(理学版), 2021, 48(4): 508-520. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-HZDX202104014.htm [5] 万岩, 杜振中. 融合情感词典和语义规则的微博评论细粒度情感分析[J]. 情报探索, 2020(11): 34-41. doi: 10.3969/j.issn.1005-8095.2020.11.005 [6] 马晓慧, 贾君枝, 周湘贞, 等. 一种基于语义相似性的情感分类方法[J]. 计算机科学, 2020, 47(11): 275-279. doi: 10.11896/jsjkx.191000174 [7] 张公让, 鲍超, 王晓玉, 等. 基于评论数据的文本语义挖掘与情感分析[J]. 情报科学, 2021, 39(5): 53-61. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-QBKX202105008.htm [8] ROHRDANTZ C, HAO M C, DAYAL U, et al. Feature-Based Visual Sentiment Analysis of Text Document Streams [J]. ACM Transactions on Intelligent Systems and Technology, 2012, 3(2): 1-25. [9] 刘逸, 保继刚, 朱毅玲. 基于大数据的旅游目的地情感评价方法探究[J]. 地理研究, 2017, 36(6): 1091-1105. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLYJ201706009.htm [10] 何雪琴, 杨文忠, 吾守尔·斯拉木, 等. 融合句法规则和CNN的旅游评论情感分析[J]. 计算机工程与设计, 2019, 40(11): 3306-3312. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-SJSJ201911047.htm [11] 方梦静. 基于社交媒体大数据的城市公园游客情感特征研究[D]. 杭州: 浙江农林大学, 2019. [12] 郭庆, 贾郭军. 基于tree LSTM的旅游评论情感分析方法研究[J]. 计算机应用研究, 2020, 37(S2): 63-65. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSYJ2020S2018.htm [13] 白晓雷, 霍瑞雪. 融合微博语言特征的CNN反讽文本识别模型研究[J]. 通信技术, 2021, 54(5): 1126-1130. doi: 10.3969/j.issn.1002-0802.2021.05.014 [14] 范昊, 李鹏飞. 基于FastText字向量与双向GRU循环神经网络的短文本情感分析研究——以微博评论文本为例[J]. 情报科学, 2021, 39(4): 15-22. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-QBKX202104003.htm [15] 严仲培, 陆文星, 束柬, 等. 面向旅游在线评论情感词典构建方法[J]. 计算机应用研究, 2019, 36(6): 1660-1664. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSYJ201906014.htm [16] 朱函杰. 基于微博数据的游客情感体验时空变化及主题探索——以西安市为例[D]. 西安: 陕西师范大学, 2019. [17] 周慧敏, 韩欣彤, 阮诗淇. 长沙市博物馆游客感知形象研究——基于网络评论分析[C] //2019年"新时代博物馆专业能力建设"学术研讨会论文集. 成都: 中国博物馆协会博物馆学专业委员会, 2019. [18] 陈志军, 徐飞雄. 乡村民宿旅游地游客忠诚度影响因素及作用机制——基于ABC态度模型视角的实证分析[J]. 经济地理, 2021, 41(5): 232-240. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JJDL202105026.htm [19] 魏鹏, 王植颖, 黄欣, 等. 成渝经济区旅游收入与产出效率的空间格局研究[J]. 西南大学学报(社会科学版), 2020, 46(6): 63-71. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XBSW202006007.htm [20] 党宁, 肖荟, 李文明. 游客亲环境行为的影响因素实证研究——基于情感与认知的双重视角[J]. 人文地理, 2021, 36(3): 185-192. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-RWDL202103021.htm