机器之心发布
机器之心编辑部
随着大模型推理和 Agent 工具调用能力的快速发展,其通过反复搜索处理复杂信息需求的效果愈发受到业界关注。近日,第三方评测机构 SuperCLUE 发布 11 月 DeepSearch 评测报告,国产大模型 openPangu-R-72B 凭借在长链推理、复杂信息检索领域的卓越表现,在模型榜单中名列第一,体现了基于国产昇腾算力的大模型研发实力。
这款 MoE 架构模型,究竟藏着哪些技术秘密,能在激烈竞争中脱颖而出?
硬核技术底座:
MoE 架构下的效率与性能平衡术
openPangu-R-72B 为考虑效率和性能平衡,重新设计了模型底座架构。作为基于昇腾集群训练的 MoE(混合专家)模型,它采用 80 选 8 的专家选择机制,在 74B 总参数量的基础上,将激活参数量控制在 15B,既保留了大模型的复杂推理能力,又有效降低了计算开销。24T tokens 的训练数据与 128k 长序列处理能力,为其处理深度搜索任务中的长文本信息奠定了基础。
为实现稳定收敛与效果提升,openPangu 团队在预训练技术上完成了以下优化。
图. openPangu-R-72B 模型架构
1)注意力机制层面引入参数式 Sink Token 技术:有效缓解了极大激活值问题,不仅提升了训练过程的稳定性,也对后续量化更加亲和;
2)采用 K-Norm 与 Depth-Scaled Sandwich-Norm 组合的架构,其中 K-Norm 仅对 attention 的 key 施加 RMS Norm,在达到与 QK-Norm 相当稳定性的同时,降低计算开销,还保留了 Query 更灵活的表达能力。
3)注意力架构的优化兼顾了精度与效率:通过增加 Query 头数和注意力头维度,让模型能从新万博体育:角度捕获细粒度语义关系;引入 Partial RoPE 机制,仅对 Query 和 Key 中 1/3 维度应用位置编码。通过将 KV 组数量减半,在 Key 头维度增加的情况下,仍实现了 37.5% 的 KV cache 缩减,平衡了推理阶段的显存占用、速度与模型效果。
4)Adaptive Aux Free 负载优化技术:Aux free 升级版本,通过自适应调整各个专家负载 bias 的更新幅度,有效减少均衡震荡,让专家负载分布更均衡。
DeepSearch 专项突破:
三大优化破解复杂搜索难题
如果说技术底座是基础,那么针对深度搜索任务的后训练优化则是 openPangu-R-72B 登顶的关键。深度搜索作为大模型访问互联网获取深度信息的核心能力,其长链推理与工具调用水平直接决定模型的实用价值。openPangu-R-72B 通过后训练阶段进行长链难题合成、非索引信息处理、快慢思考融合三大策略,显著提升了模型 DeepSearch 能力。
图.openPangu-R-72B 模型深度搜索任务执行流程,该流程同时用于模型训练和评测
1)在长链 QA 难题合成方面,openPangu 团队在 DeepDiver-V2 和 WebExplorer 技术基础上,通过 query 条件模糊化将问题平均难度提升 10%,同时借鉴《Pushing Test-Time Scaling Limits of Deep Search with Asymmetric Verification》工作的思想,引入 verification agent,大幅提升用于训练问答对的准确性,让模型在复杂推理场景中 “见多识广”。
2)针对传统搜索引擎难以覆盖的非索引知识问答 —— 如官网附件中的财务数据、学术论文引文信息获取等场景,模型训练过程中注入了 “Planner 聚焦关键 URL+ URL_crawler 爬取网页 + Document_QA 识别下一步浏览链接” 的循环工作流,通过同一站点内的多跳浏览实现了深度信息搜集,突破了传统搜索引擎的信息边界。
3)步骤级快慢融合策略则让模型的 “思考” 更具效率。DeepSearch 的 ReACT 执行过程中,不同步骤的思考强度差异显著 ——Document_QA 需分析海量网页数据与表格,对推理精度要求更高;而普通工具调用步骤更侧重效率。为此,模型为不同步骤匹配不同思考模式:Document_QA 启用慢思考保障精度,其他步骤采用快思考提升速度,实现了精度与效率的平衡。
国产算力赋能:
openPangu 系列模型彰显集群优势
此次 SuperCLUE DeepSearch 评测登顶,不仅是 openPangu-R-72B 模型能力的体现,也彰显了国产算力与大模型研发深度融合的成效。作为基于昇腾集群训练的代表模型,openPangu-R-72B 证明了国产算力平台在支撑大参数量、高复杂度模型研发方面的坚实能力。
值得关注的是,openPangu-R-72B 的兄弟模型openPangu-718B在同期 SuperCLUE 通用榜单中斩获第二名,展现了该系列在不同任务场景下的全面实力。从深度搜索的 “单点突破” 到通用能力的 “全面开花”,openPangu 系列正以昇腾算力为根基,为国产大模型生态注做出新万博体育:贡献。
随着大模型在企业服务、学术研究、政务处理等领域的深度落地,深度搜索能力将成为模型实用化的核心竞争力。未来,随着 openPangu 系列模型的持续迭代,我们期待国产大模型在新万博体育:全球顶级评测中绽放光彩。
《男人窝男人亚洲一区二区三区》,《Q8X2R7L1T4J5M9B6W3》看黄片的视频
“特黄无码AV在线一区二区”
美女隐私慢慢脱
……
12月01日
“性美女淫乱视频免费”网游新规草案链接被删
↓↓↓
12月01日,多国驻华使节走进河北石家庄:继续绿色之旅,国外一区二区三区黄色录像,91毛片视频免费看,第一宅男AV导航,26UUU亚洲视频
12月01日,河北沧州:黄骅港保税仓库完成首单货物进仓业务,一本色道久久久888,国产小u怮女天堂,禁止18岁看黄色视频,96在线精品视频免费观看
12月01日,首届全国白化茶产业大会将在湖北省咸丰县举行,91色精品视频,美日韩一二三,簧片网站在线看,欧美成aⅴ人高清 国产
12月01日|皖台青年职工在合肥比技能传匠心|nobleiec.com|久久久久亚洲精品中文字幕天堂|a片大黑吊多人伦奸巨乳老少孕妇|妺妺窝人体色77777777野大粗下载
12月01日|北京IPv6综合发展指数全国第一 推进技术创新应用|又爽又黄使劲操|嗯∽啊~轻点禁 揉胸视频观看|精品国产AⅤ一区二区三区V免费|邪恶漫画在线观看
12月01日|(新春走基层)西藏山南扎西曲登社区:尽展“藏戏第一村”的“入戏”风貌|外国人人操人人肏|欧美另类Z0Z X974|人妖大鸡巴|2020av天堂玖玖……
12月01日,【高质量发展调研行】滇池东岸卧龙古渔村焕新生 游客“Country Walk”松弛感拉满,馃悢馃悿,国产做受69 高潮游戏双男,日韩黄页网在线观看品爱网,成人动漫-nc18嫩'草
12月01日,武铁五天假期共发送旅客455万人次,18岁免费看黄片,亚洲图片欧美色图,亲孑伦XX Xⅹinin-辊柳,国产麻豆精品福利在线观看
12月01日|四川康定山洪泥石流已致10人遇难17人失联|激情性爱黄色性爱亚州性爱|国产黄色A片农村免费看|又大又长又租又爽的在线视频|色呦呦无码一区二区三区
12月01日,福建泉州:鲍鱼分苗季 海上作业忙,日韩 在线 视频 区,无打码免费小黄片,荒野乱斗光脚丫踩屏幕视频,99久久免费国产精品特黄
12月01日,老易、郎朗沈阳见,没想到“春晚等着你”还是连续剧,湿点日剧,日韩一级黄色毛片视频免费看,26uuu日韩在线中文字幕,99爱在线精品视频免费观看9
12月01日,香港漫游记:观高定时装之父设计款礼服 赏十九世纪女性时尚,免费无码黄色一级大片,欧美一级A片高潮刺激,91久久久久无码精品国产,国产免费情品AV片在线观看
12月01日|中国免签“朋友圈”持续扩容 政策积极效应不断显现 |AA的毛片|18岁以下禁看黄色毛片A片|黄色网站免费看黄色视频在线观看|又黄有色的18禁网站在线
12月01日|世界一流大学博士教育改革有哪些新趋势|国产黄色视频三级片在线|青草99人人操人人摸|av成网站|国产在线观看91福利
12月01日|北京大兴机场海关查获旅客违规携带活体寄居蟹|自拍偷拍午夜福利视频|火影18+黄油|亚洲国产尤物一级在线观看|美女黄网站色视频免费网手机版
嫦娥六号发射圆满成功,我这学历在孙吧什么水平|(两会速递)郑喆轩:三星堆考古成果将“及时上新”|久操亚洲视频|乌兰图雅裸体无删减版电影|欧美亚洲视频二区|XNXX精品无码
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺