导语

游客最关注的是“温泉”本身品质,如温质、温度、干净度、味道、疗效等相关内容;其次是跟酒店相关的泡池、价格、体验、浴衣、SPA、养生、按摩等相关设施、服务项目;最后才是包括交通、景点(樱花、建筑)、购物、美食等方面的周边配套内容。

什么温泉最吸引人?

什么时间温泉爆满?

什么温泉给人留下深刻印象?

什么温泉让人流连忘返?

随着数字化、信息化、网络化技术的发展,游客可随时随地通过电脑、手机、移动终端,获取或分享旅游信息、体验。信息的多元化和数据化,已成为现代生活的常态。因此,以互联网信息作为研究对象,通过获取游客的旅游数字足迹,分析旅游地及游客的共同特征,研究其普遍规律,对未来旅游地的发展,具有重要的意义。

数据采集

1.1温泉地选择

日本温泉在世界温泉中独树一帜,文化氛围浓厚、产业链完整、集群效应明显,温泉旅游份额占整个旅游业的50%,其发展的经验值得借鉴。因此,本文以日本温泉旅游地为研究样本。

1.2数据获取

数据选取“去哪儿”、“携程”、“马蜂窝”、“同程”、“途牛”、“新浪”等6个网站为数据爬取的平台,这6大平台的市场份额相加占总市场的70%,覆盖国内游客的大部分旅游信息。

使用Python编写代码,分别在6个网站上爬取游客的游记及评价数据,爬取字段为游记标题、游记内容、旅游地、出游时间。通过爬取,共获得初始样本1292篇,其中涉及日本温泉旅游地、出行时间、停留天数等内容的样本保留,广告痕迹重、多网站重复发表、纯粹图片组成等与研究无关的样本删除,最终筛选符合研究的样本906篇。

数据分析

2.1游记数据预处理

文本预处理,首先,将爬取到的游记文本分别保存为Excel文件和 TXT文本,把表情、图片、多余字符等内容删除;其次,同义词替换,如将“由布院”、“由布岳”、“汤布院”统一替换为“由布院”,将“泡温泉”、“泡汤”统一为“泡汤”等;最后,将游记中的日语翻译成中文,将繁体汉字统一转换为简体汉字,英文单词翻译为中文。

用“微词云网站”进行词频分析。首先,将TXT文本复制到网站上,进行文本分词;其次,对分词后的文本单词进行挑选,将缺乏具体象征意义的数词、连词、形容词、副词等词语及标点符号剔除,只留下能反应旅游热点的名词及部分动词,其中名词不包括方位名词和时间名词;最后,将分析结果以Excel格式保存下来,得到旅游足迹数据库。

2.2时间格局分析

(1)出游时间分析

基于旅游足迹数据库,提取出发时间、停留时间、旅游轨迹等信息,对时间信息进行分析。日本与我国华北地区纬度带相近,按季节划分:3-5月为春季,6-8月为夏季,9-11月为秋季,12-2月为冬季。根据数据分析,冬季赴日本温泉旅游的国内游客最多,占比高达40%,秋季出游为27%,春季出游为19%,夏季的游客仅为14%,旅游者出游时段呈现出较强的季节性。冬季气候严寒,泡温泉可以温暖强身,是最适合泡温泉的季节;秋季是日本传统赏红叶的季节;春季是日本最佳的赏樱季节,均能吸引一部分游客前往目的地观光旅游。

按月份划分,10月份游客数据占15%,全年最高峰值,原因是国庆小长假是游客出游的黄金周;第二个峰值是2月份,占12%,春节假期出行,也是泡温泉的理想时间;第三个客流相对集中的是1月、4月和12月,各占比达10%;其他月份,如6月、7月、8月,游客较少,仅占5%左右。说明赴日游客集中在秋冬季节,有较强的季节性特性,而且在时间分布上较为集中。

(2)停留天数分析

对游客停留时间进行分析,在温泉停留的时间从1~15天不等,停留5~10天的游客数量占比达84.4%,停留5天、6天和8天的游客样本占比均超过20%,停留超过10天的游客占比为8%,少于5天的占7.6%,其他天数的则较少。综上所述,在温泉地停留5~8天的游客较多。赴日旅游为出境游,所需时间较长,且游客一般选择7天长假出游;其次,温泉旅游一般以住宿为主,日本温泉及与其他旅游资源(如樱花、红叶等)相结合,易形成旅游线路上的中转站。

2.3温泉地空间格局分析

(1)温泉地偏好

根据游记样本数据统计,以频率最高的前10名温泉地作为研究对象,提及频率超过1000次的温泉地有2个(箱根、登别),500~1000的有5个(由布院、别府、地狱谷、城崎、伊豆),其他温泉地被提及频次均小于500次。排名前十的温泉地分别为箱根登别、由布院、别府、地狱谷、城崎、伊豆、热海、草津、下吕,其中,箱根被提及频次1595,占比16.44%,登别占比12.56%,由布院占比9.84%,前三位温泉地占比达38.84%,占排名前10的温泉地提及频次总和的1/3;别府、地狱谷、城崎和伊豆占比分别为7.52%、6.37%、6.15%和6.02%,其余温泉地被提及比率均小于6%,总和为22.77%。前10名均为日本传统的温泉旅游目的地,其浓厚的温泉文化氛围,深受游客喜爱。

(2)空间分布

在区域特征上,10多个温泉总体呈现出“大分散,小聚集”的空间分布格局,到访温泉地(箱根、由布院、别府、地狱谷、城崎、伊豆等)主要位于日本南部地区。

2.3游客感知分析

游记样本数据中提取的有关温泉的高频词汇,代表了游客对日本温泉地的感知印象,能够反映温泉地的总体形象。选取频数排在前30的高频词作为研究对象,按照频次从高到低分别是“温泉”、“酒店”、“泡池”、“价格”、“体验”。频次最高的词汇是“温泉”本身,其中,游客主要关注“温泉水”、“温度”、“干净”、“味道”、“地热”、“硫磺”、“疗效”、“碳酸”等相关内容;跟酒店相关的“泡池”、“价格”、“体验”、“汤池”、“浴衣”、“SPA”、“养生”、“按摩”等词汇的提及频次也较高,表明酒店的相关设施、服务项目,亦是游客关注的重点;其他高频词汇包括交通、景点(樱花、建筑)、购物、美食等方面,反映了游客对温泉地周边配套内容的在意。

结语

通过对旅游数字足迹的分析,结果表明:在时间格局上,40%的游客选择在冬季赴日本温泉旅游,游客最多的月份是2月和10月,停留时间为5~10天,并集中在秋冬季节,有较强的季节性特征;在空间格局上,游客到访排名前10的温泉地依次为箱根、登别、由布院、别府、地狱谷、城崎、伊豆、热海、草津、下吕等温泉,总体呈现“大分散,小聚集”的空间分布格局,到访温泉地主要位于日本南部地区;在游客感知方面,温泉是游客最关注的内容,其次是服务设施和内容,最后是温泉地周边的配套内容。

来源:《旅游纵览》2021,1(334),题目及内容有适当修改

作者:刘欣 高成广

原标题:日本温泉对中国游客的吸引力研究 ——基于旅游足迹的分析

图片来自Unsplash,基于CC0协议授权