猫眼电影
猫眼电影记者 谢茂芝 报道Q8X2R7L1T4J5M9B6W3
大语言模型(LLM)的「炼丹师」们,或许都曾面临一个共同的困扰:为不同任务、不同模型手动调整解码超参数(如 temperature 和 top-p)。这个过程不仅耗时耗力,而且一旦模型或任务发生变化,历史经验便瞬间失效,一切又得从头再来。
这种繁琐的试错过程,在许多研发团队的日常沟通中屡见不鲜,正如下图所展示的那样:
图 1:研发人员手动调整解码参数的日常。
一个灵魂拷问随之而来:为何不能让模型自己学会如何解码,从而实现真正的「端到端」?
事实上,各大模型厂商的 API 文档也印证了这一难题。以 DeepSeek 为例,其官方文档明确建议针对不同场景设置截然不同的 temperature 值,这使得单一的静态参数设置显得捉襟见肘。
图 2:不同任务需要不同的解码参数,这使得静态设置难以应对复杂多变的现实需求。
近日,由腾讯 AI Lab 的王琰研究员及其团队领衔,联合香港中文大学(深圳)唐晓莹教授及其博士生王志超给出了一个优雅的答案。他们推出了名为 AutoDeco 的全新架构,旨在彻底终结手动解码的「手工作坊」时代。这项研究《The End of Manual Decoding: Towards Truly End-to-End Language Models》,通过让模型动态预测并控制自身的解码参数,向着真正端到端的语言生成迈出了关键一步。
论文链接: https://huggingface.co/papers/2510.26697代码链接: https://github.com/Zacks917/AutoDeco模型链接: https://huggingface.co/collections/Jadeislaw/autodeco
图 3:AutoDeco 位居 Hugging Face Daily Papers 榜首
当前,尽管 LLM 本身已高度集成,但其生成过程的「最后一公里」—— 解码,仍然是一个独立于模型之外的、不可微的僵硬环节。研究团队形象地将其比作「手动挡变速箱」:无论引擎(LLM)多么强大,换挡(调参)依然依赖人工操作。
AutoDeco 的核心思想,就是为 LLM 装上「自动挡」。它通过在标准 Transformer 架构中引入两个超轻量的预测头,让模型在生成每一个 token 时,都能根据当前的上下文信息,动态地预测出最适合下一步生成的 temperature 和 top-p 值。其架构如下图所示:
图 4:AutoDeco(上)与传统手动解码(下)的对比。AutoDeco 将解码参数的预测无缝集成到模型的前向传播中,实现了动态自调节。
核心挑战与技术突破:如何训练一个没有「标准答案」的任务?
设想很美好,然而,一个关键的挑战摆在研究团队面前:如何训练这些预测头?在训练数据中,并不存在每一时刻「正确」的温度和 top-p 标签,这使得监督学习无从谈起。
为此,团队提出了一种创新的、完全端到端的训练策略。他们设计了一种新颖的可微分「软性 top-p」(soft top-p)机制,巧妙地替代了传统 top-p 采样中不可微的「硬截断」操作。该方法分为三步:
图 5:可微分的 soft top-p(橙色线)与传统的 hard top-p (绿色线)对比。Soft top-p 的平滑特性打通了从最终损失到解码参数预测头的梯度路径。
这一设计的巧妙之处在于,它使得从最终的「下一个词预测」损失到解码参数预测头的梯度能够顺畅回传。如此一来,模型便可以在标准的 Next Token Prediction 任务中,通过优化最终生成结果来「倒逼」自己学会如何动态调整解码策略,整个过程无需任何额外的标注数据。
AutoDeco 的惊人表现:三大亮点
通过在 Llama、Qwen、Deepseek 等多个主流模型家族上的广泛实验,AutoDeco 展现了其强大的能力:
卓越的性能与泛化能力
实验结果表明,AutoDeco 不仅稳定超越了传统的 Greedy Search 和 Default Sampling 等基线方法,其性能甚至能媲美、乃至超越了利用测试集进行精细调优的「神谕」基线(oracle-tuned baseline)。
图 6:AutoDeco 在多个数学和通用任务 benchmark 上均取得了 SOTA 性能,展现了其强大的泛化能力。
极致的效率与易用性
AutoDeco 的预测头设计极为轻量,其带来的额外推理延迟通常仅为 1.7%,内存开销也几乎可以忽略不计。对于开发者而言,接入 AutoDeco 模型仅需修改几行代码,即可享受「免费」的性能提升。
「言出法随」:开创性的自然语言控制能力
研究中最令人兴奋的发现之一,是 AutoDeco 涌现出的一种「通过自然语言控制解码」的能力。用户可以直接在 prompt 中通过自然语言下达指令,如「我希望答案更有创意」,模型便能「听懂」并自主地调高其预测的 temperature 和 top-p 值,整个过程清晰可见。
图 7:在不同指令下,AutoDeco 预测的 T/P 值变化。从左至右分别为:基线、高创造力指令(T/P 值自发升高)、高确定性指令(T/P 值自发降低)。
当然,作者坦言这种能力还不够完善,还做不到非常精准的控制。他们猜测实现细粒度、高精度的自然语言控制解码无法仅仅能通过微调 AutoDeco 模块做到,而是需要全参微调模型,这也被他们列为了 Future work 的重点。因此,作者没有放出带有自然语言控制能力的 AutoDeco heads 权重。
AutoDeco 在发布后迅速吸引全球 AI 社区的关注,在 Twitter 等社交平台上引发了顶尖学者、开发者和企业家的广泛热议和高度评价。
图 8:大模型社区对 AutoDeco 的广泛热议和高度评价。
目前,该团队已将论文、代码以及在多个主流模型上训练好的 AutoDeco heads 全面开源,包含适配于 Deepseek V3.1、Qwen3-235B、GPT-OSS-120B 等生产级大模型的版本。正如研究人员在分享中所说,这项工作旨在将研究者和开发者从繁琐的调参工作中解放出来,共同迈向一个更智能、更自动化的 AGI 新时代。
??时事1:好深好大18禁免费网站
??11月04日,“非中工业化合作不断迈上新台阶”(新时代中非合作),
猴王何其强大,所向披靡,在这片上古小世界中几乎算是金字塔族最顶尖的存在,一群老王齐上都不是它的对手,可现在却被金色浪涛击伤。
,国产女人丝袜对白AV在在线。??11月04日,方励:人生苦短,及时追梦,
石林虎大叫,取出一块没有光泽的兽骨,左臂符文闪烁,而后他猛地将此骨按了上去,与手臂相合,顿时光芒大盛,兽骨其与臂膀血肉交融,化作一体,不分彼此。
,成人免费视频 孕妇我要手,我色国产综合,别c我 啊 嗯上课呢鑫祺。??时事2:欧美第一在线视频
??11月04日,【理响中国】在新的历史起点上建设中华民族现代文明,
“我的熊掌!”小不点哀嚎,苦着小脸,无比痛惜,这才一会儿工夫那头熊就跑没影了,他想去追,但又脱不开身,真是遗憾。
?第一百一十九章 收获遗种,欧美一级囗交视频 视频,久久久无码精品亚洲日韩www,超碰在线永久看看。??11月04日,浙江横店将迈入高铁时代 预计下半年具备开通运营条件,
当你背着书包上学时,看到过指示行人过马路的斑马线吗?当你走到路口,看到过为安全站岗的红绿灯吗?当你乘坐火车、汽车时,听到过“为了您的安全,请不要把头、手伸出窗外”的热情关照吗?在我记事时,就听爸爸妈妈说“干什么事,都要注意安全”;走进校门,老师也教我们要注意安全;识字以后,在工地、路口等危险的地方都看到过“请注意安全”、“安全第一”的牌子。安全真的那么重要吗?是的,它是我们生活中永恒的主题!
,免费一级黄片视頻,二区aa级无人二区,扒开 让我 动漫网站。??时事3:粗大的🐔吧在里面伸来伸去漫画
??11月04日,贵阳贵安2023年软件和信息技术服务业收入突破800亿元,
正是因为如此稀少,所以才显得珍贵!
,亚洲免费视频通,色综合视频一区二区精品,亚洲精品中文字幕区。??11月04日,“足球进校园”,为何雷声大雨点稀?,
这若是传出去,一定会引发大轰动,惊掉一地下巴。破入这个境界已经很难了,很少听说有人连破境界,在这一瞬间连开两个洞天极其罕见,非天纵之姿不可为,被外界知晓的话,会吓到人瞠目结舌。
?第八章 青鳞鹰,国产嫖妓视频精品,亚洲午夜精品一级毛片国产,欧美 性爱网。??时事4:啪啪官网
??11月04日,加拿大劳资关系委员会仲裁要求铁路恢复运营 工会称将上诉,
尊敬的老师们,我们肩上的责任关系着学生、家庭和社会的未来,只有以充满着无私和宽容的爱心投入工作,才能无愧于我们光荣的职业。我们应以高尚的人格感染学生,以文明的仪表影响学生,以广博的知识引导学生,以博大的胸怀爱护学生,我希望我们每位教师争做学生欢迎、家长满意、同行敬佩的优秀教师。我相信,我校这支思想素质好,业务能力强,富有责任意识和进取精神的教师队伍一定能为我们每一位学生的成长和发展搭建广阔的平台!
,久久综合久久久,久久91亚洲精品中文字幕,折磨白袜小正大榨精。??11月04日,十四届全国人大二次会议举行闭幕会 习近平等党和国家领导人出席,
果然,柳树继续开口,道:“太古年间,梼杌、朱雀、饕餮等认为,在洞天境时,九洞可以称王,但十洞天才是极致,为此境真正之尊。”
,先锋影音综合资源网站网址,欧美精品A片在线播放,中国特级毛片A片全部免费。责编:詹姆斯布里吉斯
审核:白茫
责编:石晓磊












