RAG准确率提升10.6%,多项基准拿下新SOTA!
ACL 2025最新研究提出Lexical Diversity-aware RAG(DRAG)框架,首次系统性地将词汇多样性引入RAG的检索与生成过程,提供了一个轻量、通用且易扩展的解决方案。
在多项基准任务中,该方法带来了显著性能提升,尤其在HotpotQA上刷新了当前最优结果。
在大语言模型的浪潮下,Retrieval-Augmented Generation(RAG)已经成为提升模型事实性和时效性的重要手段。然而,现有方法普遍忽视了一个看似细微却极为关键的问题——词汇多样性(lexical diversity)。
同一个问题,不同的表达方式,往往让检索模型“晕头转向”,最终导致错误答案。
由此,来自北航、北大、中关村实验室的研究团队提出了这项最新工作,他们首次将“词汇多样性”引入检索增强生成的相关性评估过程,并通过新颖的风险稀疏校准机制解决了生成阶段被无关信息干扰的问题。
团队认为,该方法对信息检索、问答系统、专业领域大模型应用都具有重要价值。未来,他们计划进一步拓展该方法到新万博体育:专业场景,让大模型不仅能“读懂”,更能“理解”复杂的人类语言表达。
词汇多样性:RAG的隐形痛点
研究团队指出,现有RAG方法大多通过“单一标准”判断检索文档是否相关,但现实情况要复杂得多。如图所示,以问题“What is Hattie McDaniel’s occupation?”为例,其中的语义成分表现出不同程度“词汇多样性”:
不变词(Invariant):人名“Hattie McDaniel”一般不会变形;可变词(Variant):词语“occupation”可以对应“profession”“actress”甚至“Academy Award”;补充信息(Supplementary):答案可能依赖“American celebrity”等扩展语境。
这种词汇多样性往往导致模型错误地将部分相似但无关的文档判为相关,或者忽略了真正有用的信息。
两大关键创新
为解决“词汇多样性”带来的挑战,研究团队提出了该框架,核心在于两个互补模块:
1、Diversity-sensitive Relevance Analyzer(DRA)
传统检索相关性评估往往“一刀切”,把整体查询和检索文档进行比较。该方法则进一步拆解查询语义,针对不同成分采用差异化策略:
不变成分:如人名、地名等必须精确匹配的关键词,该方法强调其检索文档应与该成分严格匹配;可变成分:如“occupation”—“profession”,DRA借助LLM的语义扩展和分析能力,在检索时允许一定语义灵活性;补充成分:如“American celebrity”,该方法通过检索需求的明确程度来判断是否需要真正提供有用的补充证据。
在此基础上,该方法通过该模块对相似度检索结果进行重排序,输出一个更细粒度、多维度的相关性评分,避免检索时存在的“假阳性”和“假阴性”的常见问题。
2. Risk-guided Sparse Calibration
即使有了更精准的检索,生成阶段仍然可能“被干扰”。Risk-guided Sparse Calibration的设计灵感来自“风险控制”:它会实时监控每个生成token的“被误导风险”,并在必要时进行解码校准。
词汇风险(Lexical Risk):检测生成内容是否过度依赖低相关的词汇;注意力风险(Attention Risk):评估模型注意力是否集中在无关段落;预测风险(Prediction Risk):衡量当前预测是否与检索证据存在冲突。
RSC的独特之处在于它的稀疏性(sparse calibration):只对高风险token动态干预,而不会对全局输出强行重写,从而保证了生成质量与效率的平衡。
最终,DRA负责“挑选更靠谱的材料”,RSC负责“防止模型走偏”,形成了检索与生成环节的双保险,让RAG更稳健、更准确。
实验结果:显著超越现有方法
团队在多个开放域问答基准上验证了该方法:
其中,该方法在PopQA/TriviaQA(短文本问答):准确率分别提升4.9%和4.4%;HotpotQA/2WikiMultiHopQA(多跳问答):准确率均提升10.6%,展现出强泛化性;在ASQA(长答案生成):在str-em、QA-F1等指标上刷新SOTA。
不仅如此,该方法在不同类型、大小的模型上均表现出显著增益,如Llama2-7B, Llama2-13B, Qwen2-7B, Alpaca-7B和Mistral-7B等。
论文链接:
https://aclanthology.org/2025.acl-long.1346/代码(即将开源):
https://github.com/Zhange21/DRAG
《男男做爰黄✌片全过程动漫》,《P6F3X2M7T9QJ8L1B4WZR》柳岩性做爰XXXⅩ性视频
“91在线精品㊙️一区二区张津渝”
jA∨日本ⅩXX色在线观看
……
09月23日
“男女❌❌⭕️⭕️色”狐妖小红娘 镜花缘篇
↓↓↓
09月23日,冬天水果也丰收、竹林空气变成钱……智慧管理带来乡村新发现,雏田爆乳被❌🔞㊙动漫网站,同性男A片18🈲在线观看,女人又爽又黄免费白人,原神涩涩同人18❌网站魈
09月23日,中国成功发射通信技术试验卫星十三号,♥羞羞视频app♥黄版app,蒂法❌到爽🔞高潮痉挛动漫,小情侣18🈲被偷拍免费观看,他扒开我奶罩揉吮我奶头视频
09月23日,露天铁矿→蔚蓝湖泊 这些“华丽变身”藏着美丽中国的发展密码,美女吊🐔巴www爽爽爽视频,穿丝袜下面流白色液体,巨乳动漫魅魔下裸❌动漫,班长撕开乳罩揉我胸好爽动漫
09月23日|习近平对政法工作作出重要指示|小狗永远属于daddy|咒术回战H婬乱版全文阅读|末发育女学生A片|国产菊爆A片免费
09月23日|秋冬季心血管病高发 谨防与带状疱疹混淆耽误病情|女学生不戴套毛片|男男互c开荤粗肉尿在里面视频|『秀人网』超人气女神杨晨晨|粉嫩㊙️AV一站
09月23日|第十届“中国博物馆及相关产品与技术博览会”开幕|虚空女皇卡莎的cg|二次元美女18隐私免费|小樱怀孕了被灌满jing液|荷兰巜性猛交做愛……
09月23日,2024中国(张家界)国际新杂技戏剧周启幕,脱让摸无遮瑕,男c女🔞黄㊙️❌蘑菇视频,国外美女拉屎❌❌❌,二次元美女泳装图集
09月23日,过度追求社交“轻量化” 63.5%受访青年担心缺少知心人,欧美做爰性生交视频,兰州老熟肥重囗味69,东京热日本高潮喷水免费,猛男资源库
09月23日|河北沧州黄骅港保税仓库正式投运|瓦罗兰特女英雄泳衣照片|刘浩存床戏裸露全身|做运动🔞露出🍑视频软件麻豆|外国打扑克爽❌又黄❌视频
09月23日,(澳门回归25周年)澳门科技大学校长李行伟:澳门也可以是教育及创科之都,㊙️天堂AV在线AV在线蜜诱,成A人无码AV无码免费专区人妻,休内谢精一汇编5主要内容概括,汤不热vlog破解版免费版
09月23日,中越边境线上的“生命通道”,萧炎❌曹颖18禁羞羞小说,Free HD XXXX movies,PornJAVOnline✅,巨胸爆乳露双奶头被的网站
09月23日,(两会观察)7天人代会:“小片段”折射民主“大全景”,女被❌c🐻黄扒衣服漫画,免费➕无码➕精品➕国产79在线,闺蜜扒开我的腿用黄鳝,揉搓胸大养马女激情视频观看
09月23日|时政微纪录丨习主席的欧洲时间(第一集 春到巴黎)|少女动漫人物嗟嗟嗟免费观看|照美冥疯狂❌自慰喷水|谜漫画官网app下载入口免费|变态男把手弄进我的🍑里视频
09月23日|新疆阿克苏地区乌什县发生7.1级地震 23趟列车运行受影响|体育生爽擼又大又粗的雞巴|东欧宝藏|妇科诊所裸体妇科检查XXX|美女18秘免费
09月23日|深港金融“六联通”成果丰|白屁股美女菊眼交6|18🈲无打码|女初高中拍击网站|诺艾尔・希尔巴
红山动物园 丑猴博物馆,国足比分预测|如何让少数民族传统体育进入更多人的视野|黑人巨大两根挤进一个|18🈲流白浆❌❌小蘑菇|3x27CC是免费打开|动漫美女裸体㊙️免费视频
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺