在当今互联网时代,搜索功能已成为连接用户需求与海量信息的关键桥梁。对于美团这样的本地生活服务平台而言,搜索体验的优劣直接关系到用户的决策效率和平台的商业价值。面对用户输入简短、模糊、口语化甚至包含错误的查询词,如何精准理解其真实意图并返回相关结果,是搜索技术面临的核心挑战。查询改写技术(Query Rewriting)应运而生,旨在将原始查询转化为更能表达用户意图、更匹配系统文档的查询形式,从而提升搜索的相关性和召回率。
一、查询改写技术的核心价值与挑战
在美团搜索场景下,查询改写技术的价值尤为凸显。用户搜索“附近好吃的火锅”,其潜在意图可能包括寻找高评分、有优惠、特定品牌或适合聚会的火锅店。原始查询的模糊性可能导致结果不全面或偏差。通过改写技术,系统可以生成如“海底捞 优惠套餐”、“重庆老火锅 评分4.5以上”、“多人包间火锅店”等一系列扩展或精炼的查询,从不同维度满足用户需求。
实践之路充满挑战:
- 意图多样性:同一查询在不同上下文(如地理位置、时间、用户历史)下意图可能不同。
- 语义鸿沟:用户自然语言表达与系统内结构化数据(如商户标签、菜品名称)之间存在差异。
- 效率与实时性:改写需要在毫秒级内完成,不能影响搜索的整体响应速度。
- 评估难度:如何准确衡量改写查询对最终业务指标(如点击率、转化率)的提升效果。
二、技术探索:从规则到深度学习
美团搜索团队在查询改写技术的演进上,大致经历了三个阶段:
1. 基于规则与词典的初级阶段
早期主要依赖人工的规则、同义词词典和热门查询模板。例如,将“火锅”关联到“四川火锅”、“涮羊肉”,或将“好吃的”标准化为“高评分”。这种方法直观可控,但覆盖范围有限,难以应对层出不穷的新表达和复杂语义,维护成本高昂。
2. 基于传统机器学习的演进
随着数据积累,开始采用统计机器学习方法。例如,通过分析海量搜索日志,挖掘查询词之间的共现关系、会话关联,构建查询扩展模型。隐式反馈数据(如点击、购买)被用来学习查询与文档的相关性,从而指导改写。这类方法数据驱动,覆盖能力更强,但对特征工程的依赖较大。
3. 基于深度学习的深化应用
当前,深度学习已成为主流。美团探索并实践了多种先进模型:
- 序列到序列(Seq2Seq)模型:将原始查询作为输入,直接生成改写后的查询。通过引入注意力机制,提升生成质量。
- 预训练语言模型(如BERT、ERNIE)的应用:利用其在语义理解上的强大能力,进行查询意图分类、查询对相关性判断以及生成式改写。例如,通过微调预训练模型来识别“附近口碑好的川菜馆”中的核心意图(菜系:川菜)、属性(口碑好)和范围(附近)。
- 融合知识图谱:将美团丰富的本地生活知识图谱(包含商户、菜品、地点、属性等实体及关系)融入改写过程。例如,当用户搜索“星巴克新品”,系统能识别“星巴克”为品牌实体,并关联知识图谱中该品牌当前季度的实际新品名称进行精准改写或补充。
- 强化学习优化:将整个搜索排序环节作为环境,以最终的用户满意指标(如下单率)作为奖励,训练改写模型,使其生成能导向更优最终结果的查询。
三、工程实践:系统架构与效果评估
在工程落地上,美团构建了高效、稳定的查询改写系统。其核心架构通常包括:
- 实时分析模块:对用户原始查询进行快速解析、分词、实体识别。
- 多路召回策略:并行触发基于规则的改写、基于模型(深度学习模型)的改写以及基于实时热点(如突发新闻、新上架商品)的改写。
- 融合与排序模块:对多路产生的候选改写查询进行去重、相关性打分和排序,选取最可能提升搜索体验的Top N个改写查询,送入后续的召回与排序引擎。
- 在线学习与更新:系统能够根据线上实时反馈数据,快速调整模型或策略,适应变化。
效果评估体系分为离线评估和在线A/B测试:
- 离线评估:使用人工标注的测试集评估改写的准确性、相关性和流畅度;计算改写查询与点击文档之间的语义相关性指标。
- 在线A/B测试:这是黄金标准。通过对比实验,直接观察引入或优化改写技术后,对核心业务指标如查询满意度、点击率、转化率、交易金额等的影响。只有在线实验证明有显著正向收益的技术迭代才会被全量发布。
四、未来展望
查询改写技术的探索永无止境。美团搜索将继续在以下方向深化实践:
- 多模态与跨模态理解:结合用户上传的图片、语音进行查询改写。例如,用户拍摄一种菜品图片搜索,系统能准确识别并改写为对应的菜名及相关查询。
- 个性化与上下文感知:更深层次地融合用户画像、实时地理位置、历史行为乃至当前会话的上下文,提供“千人千面”的精准改写。
- 可解释性与可控性:让深度学习模型不再是“黑箱”,使改写结果对运营和产品人员更可理解、可干预,平衡算法的智能与业务规则的控制。
- 端到端联合优化:将查询改写与文档召回、结果排序等下游任务进行更紧密的端到端联合建模与优化,追求全局最优的搜索体验。
###
美团搜索中的查询改写技术,是从简单规则到复杂AI系统不断演进的缩影。它不仅是自然语言处理技术的应用舞台,更是深刻理解用户、连接线下丰富服务的关键一环。通过持续的技术探索与扎实的工程实践,美团致力于让每一次搜索都更智能、更贴心,最终实现“帮大家吃得更好,生活更好”的使命。这背后,是计算机信息技术咨询服务所倡导的以技术驱动业务、以数据赋能决策的核心理念的生动体现。