7000字长文解读AI大模型智能旅游规划项目方案(AI产...
type
status
date
slug
summary
tags
category
icon
password
网址

AI大模型智能旅游规划项目实战复盘
上一篇文章,和大家聊了一下这个项目,做了一个整体性的复盘,但主要是以业务和团队等方面说的,但是实现方案和大模型相关评估上,说的不多,这篇文章,我们就在产品实现方案和大模型这块来聊一下。
AI旅游规划H5用户端https://m.lvtuai.com/——大家复制链接去试用。
这个项目主要是让用户通过对话,利用大模型来实现旅行行程规划。
1、整体流程
核心的流程:收集用户意图 → 行程框架规划 → 每日景点规划 → 行程路径规划→ 结果展示
详细流程图如下所示。
我们将流程更详细的说一下,这样大家对项目逻辑和作用,之后在哪些环节使用大模型,哪些环节不使用大模型就会更请清楚。
1.1、信息收集
首先我们需要收集用户的旅行规划相关信息,有了这些信息,才能作为大模型的输入。
输入的方式提供了三种模式:
a、快捷输入方式——每个快捷方式预设提示词,比如说周末周边游,预设情侣一男一女,获取定位确定地区,不出省内,2天1夜,休闲,价格适中,自驾出行
b、通过文字、语音、图片——在对话显示框中给出提示词,提示用户提供必要的信息
c、长途旅行——模版信息填写提交,让用户填写必要的信息,然后提交
1.2、信息判断
用户填写信息之后,对于快捷方式和长途旅行的模版信息,都是有标准信息的,基本可以进入旅行规划,但是针对用户输入框输入的需要做两件事情
a、判断用户信息是不是旅游相关及与旅行规划相关,如果不是,则需要提醒用户
b、用户输入的信息是否满足规划所需的最低信息
1.3、旅游行程宏观规划
当我们收集到用户的旅行相关意图信息并且判断符合规划启动条件时,就开始规划整个行程的宏观内容,也就是整个行程总的天数,哪些地区,行程包含哪些类型的景点等
1.4、旅游行程微观规划
在宏观规划之后,进一步的规划每一天的行程,包括吃、住、行、玩的各方面。
进一步将这些元素进行按照时间从早到晚进行组合,规划路径,提供进一步的行程建议。
1.5、结果展示
最终,我们将宏观规划和微观规划的行程,打包之后组合成一个完整的行程,然后按照一个固定的展示框架输出给前端进行展示。
2、业务流程中大模型与传统编程的使用取舍
上面我们较为详细的说了一下整个的流程,现在我们进一步讨论,这整个业务流程中,哪些选择使用大模型来处理,哪些还是使用传统的方式来处理,以及为什么这么做。
2.1、信息收集
这个环节中,涉及到用户通过输入框来输入信息,里面有语音及图片方式,需要模型来解析用户的语音及图片,这涉及多模态的理解,用户意图的提取,这里是必须要用到大模型的。
2.2、信息判断
需要判断用户的输入信息是不是旅游相关信息,如果不是,需要提醒用户聊跟旅游相关的,用户问了旅行相关信息,则回复用户,比如最近哪里适合旅游。
并且进一步判断,用户输入的信息是否和旅行规划信息相关,是否满足出发旅行规划的最少参数。
如果判断用户输入的信息不足,则需要对用户进行追问,提醒用户还确实哪些信息。
以上这些都是需要大模型来处理。
2.3、旅游行程宏观规划
当识别到用户旅行规划信息已满足规划需求时,则将相关信息和预设的旅行规划提示词作为输入,给到大模型,由大模型进行规划,给出整个行程的基调。
2.4、旅游行程微观规划
根据宏观规划中整体的方向+每一天的行程重点+限制条件(比如当日景点数+单日经费标准)作为输入,让大模型规划每日行程,包含早中晚餐食,景点。
以上部分采用大模型来规划,以下部分则采用固定算法处理。
为了达到让行程的景点数据为可用数据,则将行程景点在大模型规划的时候多规划一些作为冗余,然后再对接三方API数据进行查询,将不可用的景点剔除,对剩下的按照最优路径法从早餐店开始规划直到入驻酒店。
如果无效景点数据过多,则需要重复大模型规划进行补齐。
2.5、结果展示
规划完成之后,还需要做一些补充,比如将从第三方获取的景点信息等,再让大模型进行一些加工,提炼景点的一些特色信息,简介等方便给用户做出更标准的展示。
最终将整个方案,按照固定逻辑展示给用户端,这里不是让大模型直接输出展示,也不是让大模型来生成每次的界面,而是使用传统前端控制的方式来处理。
2.6、各个流程节点总结
以下是各个流程节点涉及模型及其作用
3、业务节点评估维度
通过以上每个节点中涉及的大模型,我们进一步讨论,怎样评估哪个环节使用哪个大模型,又如何设计评估维度、指标、测试集等让最终应用达到一个好的效果。
3.1、信息收集
用户说话可能乱糟糟的:打字、发语音、甚至发一张照片。模型第一件事就是搞明白用户到底想去哪、玩几天、和谁去、花多少钱。
字段准确率:用户说“五一去西安3天”,模型必须听出“西安”和“3天”。要是把“西安”听成“西藏”,后面全白干。这是最基础的。
偏好召回率:用户说“我喜欢历史,也爱吃小吃”,模型漏掉“爱吃”的话,推荐的行程可能全是博物馆,没有美食街。用户会觉得“你没听懂我”。
多模态识别准确率:用户发一张海边照片说“想去这儿”,模型得认出这是三亚。或者发语音说“去成都”,得转成文字。这个指标看模型能不能处理“非打字”的输入。
3.2、信息判断
用户经常只说一半,比如“想去成都”。模型不能瞎编,得知道还缺什么,然后礼貌地问。
缺失字段识别率:用户没说玩几天,模型得知道“缺的是天数”,而不是去问“您喜欢什么景点”。
追问相关性:缺天数就问“您打算玩几天?”;别缺天数却问“您预算多少?”——跑题了。这个指标看模型问的是不是缺的那个东西。
追问简洁性:一次问太多问题,用户烦;一次问太少,来回好多轮。最好一次问1-2个。这个指标看模型会不会“话痨”。
多轮对话效率:从用户说“想去重庆”到模型把目的地、天数、人数、预算都问清楚,平均要聊几轮?轮数越少,用户越爽。
用户可能会问“今天天气怎么样”甚至不礼貌的问题。AI旅伴只做旅游,不该答的要拒绝,但拒绝后要引导回来。
拒答准确率:用户问“怎么写Python”,模型不能说“我推荐你去颐和园”。要直接说“我只懂旅游哦”。这个指标看模型能不能分清边界。
误拦率:用户问“去西安穿什么衣服”,这是旅游问题,不能拒答。误拦率就是看模型有没有错杀好人。
引导有效性:拒绝后不能冷冰冰结束,要说“你可以继续问我行程问题”。这个指标看模型会不会把用户拉回正题。
3.3、旅游行程宏观规划
用户不想一上来就看每天几点去哪,太晕。模型应该先给个整体概览:主要去哪些区域、大概花多少钱、行程松还是紧。
区域划分准确性:去西安,模型说“主要玩古城、曲江和临潼”,这靠谱;如果说“主要去高新区逛街”,那就错了。区域对了,后面才不会跑偏。
景点类型匹配度:用户喜欢自然风光,模型说“主要看博物馆和寺庙”,类型就不对。这个指标看模型有没有抓住用户爱好的大方向。
预算估算误差:用户预算5000,模型估2000,后面用户看到真实价格会骂你。误差别超过20%,这是信任问题。
整体节奏合理性:带老人小孩,模型说“每天暴走3万步”就找死。这个指标看模型会不会根据人群和天数调整松紧。
3.4、旅游行程微观规划
用户确认概览后,模型给出每天几点去哪、怎么去、吃什么、住哪。必须真实可行,不能坑人。
时间可行性:一天所有景点玩下来加上坐车时间超过10小时,用户根本走不完。这是硬杠杠。
地理可行性:两个相邻景点坐车超过1小时(市内),用户半天浪费在路上。要顺路。
营业时间匹配:推荐晚上8点去下午5点关门的博物馆,用户白跑。这个指标看时间对不对。
顺序合理性:把距离远的两个排一起,而不是顺路排,用户多走冤枉路。这个指标看路线顺不顺。
节奏合理性:一天塞8个景点累死,一天只1个景点又亏。3-5个比较合适。太密太松都不好。
偏好匹配度:用户喜欢历史,却推荐一堆游乐园,那就是没听进去。这个指标看个性化够不够。
预算匹配度:用户选经济型,你推荐五星酒店,预算超了。要符合用户说的档次。
信息丰富度:只给景点不给交通、酒店、美食,用户还得自己查。这个指标看方案是不是“一条龙”。
宏观-微观一致性:宏观说“主要玩古城”,微观第一天却跑去新区。用户会觉得你前后矛盾,不靠谱。
3.5、结果展示
对于三方返回的景点数据,有时候过多,无法再用户端完全展示,需要大模型给进一步提炼出特色标签,对内容进行精炼。
3.6、通用指标
这些不针对某个环节,而是看整个产品快不快、稳不稳、安不安全、贵不贵。
时间效率:用户从提交到看到完整行程,总共等多久?超过10秒就悬了,超过15秒可能流失。分段计时可以定位哪个环节慢。
鲁棒性:用户会打错字、说一半、中途改主意、前后矛盾。模型要能扛得住这些“脏话”,否则真实场景没法用。
安全:绝对不能推荐危险活动(如半夜爬野山),绝对不能泄露用户手机号、住址。这是红线,零容忍。
成本:每调用一次模型都花钱。如果一次行程花太多钱,用户量大时公司亏本。要控制在合理范围。
4、测试集与提示词设计
4.1测试集设计
我们上面已经针对各个业务流程节点中用到大模型的地方设计了评估维度和指标,然后我们针对每个节点的业务情况,设计测试题,大致标准如下,具体题目就不展示了。
分阶段:先测听懂,再测规划大方向,再测每日细节,最后测抗干扰能力。哪一关过不了,都知道问题出在哪。
贴近真实:测试用例来自真实用户行为(语音、图片、信息不全、中途改主意),不是出题老师编的完美案例。
全面:模拟每个节点可能出现的各种场景,样本量保持充足。不只测模型“聪不聪明”,还测它“会不会聊天、会不会追问、会不会拒绝、会不会展示”。
这套测试就像AI旅伴的“驾照考试”——科目一考交规(听懂意图),科目二考倒库(追缺失信息),科目三考路考(宏观+微观规划),科目四考文明驾驶(拒答非旅游问题)。全部通过,才能放心让用户上路用。
4.2提示词设计
4.2.1 AI旅游项目的提示词设计概述
以下是对 AI 旅伴项目各节点提示词设计的概述,聚焦于“为什么这样设计、设计时怎么想、用了什么方法”,不包含具体提示词内容。
4.2.2提示词的设计原理
Loading...
.png?table=collection&id=cbe6506e-1263-8358-a4d7-07ce62fcbb3f&t=cbe6506e-1263-8358-a4d7-07ce62fcbb3f)