家人们谁懂啊?小新最近被大模型给雷得外焦里嫩。

我有个朋友要从兰州来北京,我说咱去看一下攻略,好多景点要预约。朋友大手一挥说:“没事儿,我去携程问”。然后就问出了这么个结果:

打开网易新闻 查看精彩图片

早上去天坛,下午去前门大街,重点来了,傍晚时分去国博。不是,国博下午四点就不让进了,你让我傍晚去?这来北京旅游的第一天就“真刑”啊?

根据携程问道的思路,头一天晚上去国博,第二天无缝衔接去看升旗玩故宫,然后再去南锣鼓巷;第三天再去颐和园和圆明园。

打开网易新闻 查看精彩图片

就算是特种兵来了,看见这个旅游规划都得摇摇头,它还说考虑到了便利性,很轻松?

打开网易新闻 查看精彩图片

但我朋友他不信邪啊,觉得这不是大模型的问题,是他提问的问题,然后就又试验——去甘肃旅游5天推荐哪里?

第二天还算正常在兰州玩一玩;第二天推荐去塔尔寺与东关清真大寺;不是携程啊,咱们就是说,这俩地方它在青海啊,它是西宁的啊,你要不要这么离谱啊。

打开网易新闻 查看精彩图片

同样的问题我在KIMI和通义千问上验证了一下,推荐的各不相同,但是没出现把青海景点当甘肃景点的乌龙。

打开网易新闻 查看精彩图片

KIMI

通义千问
打开网易新闻 查看精彩图片
通义千问

然后朋友又问携程问道,最近去甘肃的甘南玩需要穿什么?推荐甘南的什么景点?其实是想为难一下携程问道,因为甘南天气已经很冷了。

结果问道说,甘南的天气未提供。咋的?直接绕过了,咱就不能买个天气数据吗,这不是旅游必备的吗,实在不行,咱不用大模型,咱用爬虫抓都能抓出来天气数据啊。

打开网易新闻 查看精彩图片

同时也看了看KIMI和通义千问的作答,因为问的问题比较笼统,但是这两个平台也都给出了一些方案。

打开网易新闻 查看精彩图片

KIMI

打开网易新闻 查看精彩图片

通义千问

对了,携程问道能精确地回答啥问题呢,我试了试它推荐我问的问题:

广州为什么叫羊城?

如何感受新加坡的美食文化?

凤凰传奇演唱会必会的大合唱歌曲是啥?

打开网易新闻 查看精彩图片

但是这几个问题,更方便的是去某度或者某书啊。

总结一下,用户出行都在纠结“去哪玩”“怎么玩”“怎么玩更划算”的问题,在旅游大模型身上,用户对于携程问道的期望,是能够代替甚至超越传统旅行社的职能,给出一些可用且合理的旅行建议。

但是目前,不论是海外的Expedia、Kayak、Skyscanner、Hopper,还是国内的携程问道,大家推出的AI工具,都有层出不同的bug。

例如Expedia接入的是ChatGPT模型接口,它就曾对GPT“一本正经的胡说八道”表示无奈。Expedia 这样说:我们“已经采取措施以限制不准确的结果和不当响应;有时候,其体验可能与预期存在一定距离。”

特别是到了中文语境中,大家都对旅游大模型是否能适配“捏把汗”。今年7月初发布国内第一个旅游大模型时,梁建章曾介绍,“携程问道”是在通用大模型的基础上,筛选200亿高质量非结构性旅游数据,结合携程现有结构性实时数据以及携程历史训练的机器人和搜索算法,进行了自研垂直模型的训练。

他认为,相比常见的通用大模型,“携程问道”的最大优势是其在旅游行业的多年经验。“携程全球有几万名员工分布在世界各地,他们是旅游专家,所以携程能够比较低成本、高效地去做这部分的工作,把算法、人工跟实时的数据结合起来。”

所以许多用户把自己的旅游计划交给携程问道安排,是希望可以找到更省心的解决方案,虽然AI助理不可能完全代替消费者的决策,但是起码也要给出更贴近实际的方案嘛。

现在回头来看,国内旅游行业的首个大模型,先得克服在旅途中倒忙啊!

打开网易新闻 查看精彩图片