网友热议:安[徽一国企原]董事长被查_新万博体育

新万博体育

图片
搜索
猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

LeCun团队开源首个代码世界模型:能生成代码还能自测自修

2025-09-24 05:20:48
来源:

猫眼电影

作者:

甲丁

手机查看

  猫眼电影记者 张冬云 报道P6F3X2M7T9QJ8L1B4WZR

衡宇 发自 凹非寺量子位 | 公众号 QbitAI

刚刚,Meta FAIR推出了代码世界模型!

CWM(Code World Model),一个参数量为32B、上下文大小达131k token的密集语言模型,专为代码生成和推理打造的研究模型

这是全球首个将世界模型系统性引入代码生成的语言模型。

与现有代码大模型相比,CWM最与众不同的一点在于,它不仅能生成代码、理解语义。

更关键的是,它“懂得”代码如何执行,能模拟代码运行过程中变量的状态变化与环境反馈,从而推动代码理解、调试乃至规划的整体能力提升。

也就是说,它具备接近人类程序员的思考能力。

在多个代码与推理任务上,CWM均有出色表现,譬如其在SWE-bench Verified得分65.8%,领先所有开源同规模模型,已接近GPT-4级别。

更重要的是,Meta FAIR这次开源了模型代码、训练细节以及多个阶段的权重检查点,诚意十足。

有人给LeCun留言问:

“你不是一直认为语言模型只是AI道路上的一个支线(LLMs are an off ramp),怎么又推出了以语言模型为基础的世界模型?”

LeCun轻松回复称:

是的,不过咱现在讲的是编程,不是ASI哟~让大模型“懂动态执行”

CWM的诞生,直击当前大模型在代码生成中的一大痛点:

尽管现有大模型已经具备写代码的能力,但代码执行效果并不稳定,生成内容难以调试、不可执行,甚至存在隐藏逻辑错误。

FAIR团队认为,其根源在于大模型只是把代码当作文本来预测。

它不理解代码会如何运行,对变量状态的变化、函数调用的副作用一知半解(甚至一无所知)。

在FAIR团队看来:

如果希望模型像程序员一样思考,就必须教会它代码执行的“世界状态”变化。

因此,CWM首次在训练过程中引入代码世界建模(code world modeling)的概念,明确让模型学习“代码运行过程中,程序状态如何一步步演变”。

这意味着,CWM的理解维度,从静态文本跃迁到了动态执行。

Meta FAIR专攻AI与代码生成的资深研究科学家,也是CWM的资深核心贡献者Gabriel Synnaeve在上分享了CWM追踪执行计算”strawberry”中”r”个数的代码的例子:

你可以把它想象成一个可以设置为任何初始帧状态的神经‘pdb’,推理可以作为工具在标记空间中查询。

相较于传统代码大模型生成token接token的静态预测,CWM在三大能力有所升级——

第一,代码执行模拟。

CWM可以逐行模拟代码执行过程,预测每一行代码如何影响变量状态,甚至提前判断出执行中的潜在错误。

这种能力为构建“神经调试器”提供了可能。

在CWM的推理过程中,变量状态可以随代码运行不断更新。

它甚至可以模拟终止条件、循环展开、边界情况,从而更精准地理解程序逻辑。

第二,自我调试与修复。

不止会写代码,CWM还能自测、修错。

它能够在生成代码后自动构造测试用例,并在发现代码失败后用多种修改路径来尝试自我修复。

整个流程模拟了人类程序员常见的开发闭环:写→测试→改→再测。

第三,推理与规划能力。

面对复杂问题时,CWM还能进行推理与规划。

例如,在编程竞赛或数学任务中,它可以根据问题描述分析步骤、规划函数结构,再结合执行预测逐步生成并验证代码,展现出多轮逻辑推理能力。

CWM模型信息:参数、架构、性能一次看全

CWM的模型架构采用了64层的decoder-only Transformer,参数规模为32B。

它支持131k tokens的长上下文输入——这大幅拓展了复杂项目、多文件代码、文档上下文的处理能力。

相对应的,Attention结构采用了局部+全局交替机制,兼顾效率与上下文覆盖。

FAIR提供了以下3个checkpoints,供研究人员使用:

CWM预训练模型:例如用于新的后训练方法。CWM SFT:例如用于强化学习研究。CWM:例如用于推理时间扩展。

在与多个一线模型的评测对比上,CWM成绩如下:

SWE-bench Verified得分65.8%,领先所有开源同规模模型,接近GPT-4级别;LiveCodeBench v5得分68.6%,展示高复杂度编程任务上的准确性;Math-500得分96.6%,AIME 2024模拟题达76.0%;Terminal-Bench得分26.3%,高于Gemini 2.5 Pro;Aider Polyglot(多语言代码生成)得分35.1%,与Qwen3-32B相近。

综合来看,CWM在理解、生成、验证、修复等多个环节上,都有不俗表现。

FAIR团队称CWM验证了“代码世界建模”对提升推理与代码生成的价值。

Gabriel Synnaeve表示:

我对我的CodeGen团队所做的工作感到无比自豪!这个团队由博士生和经验丰富的资深员工组成。我们所有人都齐心协力,全力以赴,绝不将任何问题归咎于他人。整个Meta AI社区都为此共同努力。非常感谢整个领导层始终如一的支持。

三阶段训练流程,与数据集构建

CWM分三阶段进行训练——

第一阶段,预训练阶段(Pretrain)。

在这个阶段,CWM使用了8T tokens的数据进行通用语言与代码建模训练。

其中代码占比约30%,上下文长度为8k token。

第二阶段,中期训练阶段(Mid-train),这也是CWM最具特色的一步。

在这个阶段,模型引入了5T tokens的世界建模数据,用于训练模型识别“代码运行过程中,程序状态如何变化”。

这部分核心数据类型包括:

Python执行轨迹数据来自数千万函数调用与代码提交,记录每一行代码执行时变量的值如何变化;ForagerAgent数据模型驱动的智能体在真实Docker环境中运行代码,修复Bug,执行任务,生成真实交互轨迹(共300万条);自然语言描述版本将执行过程转化为自然语言,便于泛化迁移。

也是在这一阶段,CWM的上下文能力扩展到了131k token,支撑对大型项目和代码流程的完整建模。

第三阶段,后训练阶段(SFT+多任务RL)。

最后,CWM进行了100B tokens的监督微调训练(SFT)和172B tokens的多任务强化学习(RL)训练。

训练任务覆盖了真实软件工程任务(如SWE-bench)、编程竞赛问题(CodeContests等)、数学推理题目(如AIME模拟题、MathQA)。

在这一阶段,FAIR团队使用异步RL机制、分布式环境以及自举方法,提升了模型在多环境、多任务间的泛化能力。

基础设施方面,CWM训练使用了FlashAttention-3、FSDP+TP并行策略,并采用fp8低精度加速。

Meta FAIR强调其训练过程遵循了Frontier AI Framework中的前沿AI安全框架。

结果表明,CWM不会对网络安全、化学、生物等高敏感领域构成滥用风险。

此外需要注意的一点是,当前CWM的世界建模数据仅支持Python语言,尚未覆盖C++、Java等主流语言或符号执行任务。

不过,研究团队表示未来将探索多语言扩展,有望形成自动化编程助手的通用框架。

Two More Things

BTW,如果你想使用使用CWM,有两点需要特别注意:

第一点,CWM主要面向代码理解与复杂推理研究,没有做RLHF。

因此,它并不适合对话任务或作为Chatbot使用。

第二点,CWM明确定位是“研究用”,即仅供非商业研究使用。

Anyway,总之,CWM团队选择了模型开源、数据透明、训练复现全开放。借此也向研究社区抛出一个重要问题:

如果大模型能理解世界,它能成为更好的程序员吗?

??时事1:188金博网如何下载

??09月24日,世界女排联赛香港站打响 中国女排3比0完胜保加利亚,

  石村众人或张开巨弓,或手持阔剑,或轮动狼牙大棒,如猛兽出闸般,带起一股狂风向前冲去,激的乱叶飞舞。

,米乐的网址是多少。

??09月24日,云南进入两会时间 一张照片“晒出”民营企业发展信心,

交通事故起诉需要哪些材料?

交通事故起诉需要哪些材料?

(一)民事起诉状,人民法院和每位被告各一份;

(二)证据材料,主要包括:

1、医疗机构出具的医药费、住院费等收款凭证、病历和诊断证明;

2、医疗机构出具的误工时间证明、工作单位出具的收入证明;

3、用以证明交通费的正式票据;

4、受害人及近亲属的户籍证明,如受害人系农村户口,最好提供发生交通事故时已在城镇居住一年以上、且有固定收入的证明;

5、受害人丧失劳动能力或者伤残的证明;

6、被扶养人与受害人系近亲属的证明,以及被扶养人为未成年人或者丧失劳动能力又无其他生活来源的证明;

7、其他证据材料,如《交通事故责任认定书》等。

以上证据材料需根据案件具体情况做相应增减,并按民事起诉状的份数提交给人民法院。

(三)还需向人民法院提交原告身份证复印件或者营业执照副本复印件等材料。

(四)如委托律师代理,需与律师事务所签订委托代理合同,签署授权委托书。

?金条逾期了会坐牢吗,起诉流程是什么,365足球外围,百老汇app安卓版下载,宝博游戏平台。

??时事2:九游平台网址

??09月24日,比利时博物馆珍藏明朝鱼藻纹盖罐失窃,

  罗浮大泽、金狼部落、雷族三方人马退到五里外,留下部分人在原地,张开巨弓,射出一道道燃起火焰的箭,攻向石村。

,B体育怎么样,威尼斯人游戏下载人,可赢钱的游戏。

??09月24日,大庆市:全新政策打造东北振兴人才集聚回流先行地,  6月17日,澎湃新闻(www.thepaper.cn)从陈政高同志多位亲友处获悉,住房和城乡建设部原部长、党组书记陈政高同志,因病于2024年6月16日在北京逝世,享年72岁。,完整比分,比分直播,bet9官方网址,凯发娱乐官网登陆页。

??时事3:kb88凯时注册

??09月24日,青年台商初访汽车大省吉林 看市场寻合作,

  曾经繁荣的巨城成为了废墟,适合生灵繁衍的广袤平原而今死气沉沉,尽是残骨,血流成河。

,日博体育在线试玩,手机买球appXIAZ,万博ManBetX网页版。

??09月24日,山西襄垣:新“鸡”遇唱响“致富曲”,

  1、学校管理工作千头万绪、纷繁复杂,尽管如此,学校的一切工作都应该为了学生的发展、教师的发展、学校的发展和教育的发展,将管理与发展等同起来,管理就是发展。学校管理就是人、财、物、信的管理,最终达到物尽其用、人尽其才、才尽其用的管理格局。永兴中心学校的目标已经确立,当然校长首当其冲起着决定性作业,因此必须做到:①、勇挑重担,还要走上坡路,做一个有作为的校长;②﹑校长要事事亲临亲微,做一个率先垂范的校长;③﹑做一个解放思想,更新观念的领头者④、大事讲原则,小事将风格,做一个高风亮节的校长;⑤、严谨治学,做一个专家型的校长。只要严格履行好校长职责,狠抓学校内部管理,就会找到规律,反复出现的问题要在规律中去找,偶尔出现的问题要在履行职责中去找,经常存在的问题要在思想和观念中去深刻割析。

,香港马经,足球比赛188,bet362体育。

??时事4:大富豪彩票平台

??09月24日,中国驻菲使馆提醒在菲中国公民注意防范登革热,

  “你们几个都想与我争吗,尽管试试看,看一看谁才是第一天才!”从蛟上跳下来的孩子冷笑道。

,打鱼注册送200元,my188bet体育,贝搏体育官方网站首页。

??09月24日,广东省珠海市斗门区莲洲镇党委书记刘桂柱被查,

  我们愿以自己的努力和汗水换来 十九 中 中考 成绩新的突破!

,万博体育网,欧宝官网买球,真人国际艺术教育集团。

责编:王嵎生

审核:波莉亚娜·冲本

责编:张宇认

相关推荐 换一换