(7分钟完整指南)什么是反水?安卓版v8.6.14.47.93.96.96-2265安卓网_新万博体育
什么是反水? 最近更新|更新列表|字母检索|下载排行|苹果专区|分类导航

当前位置:首页电脑软件巴基斯坦外交部宣布召回驻伊朗大使 → 什么是反水? v3.844.8307.139187 安卓最新版

什么是反水?

什么是反水?

  • 电脑版下载
猜你喜欢
标签: 什么是反水? 全民捕鱼大战下载
详情
介绍
猜你喜欢
相关版本

什么是反水?截图J8B1X4R6M2L9T5Q3W7PZ

内容详情

什么是反水?

新智元报道

编辑:KingHZ

【新智元导读】自然语言规划的模糊性让仓库生成屡屡翻车。微软RPG用图谱取代文字,节点代表功能与文件,边标注依赖与接口。基准显示,功能创新率11-13%,代码通过率69.7%,远超Claude Code,为大规模AI开发铺平道路。

近年来,大模型写代码的能力突飞猛进。在函数级、文件级上,生成已相当可靠;开发者一句描述就能得到完整函数或模块。

但当视野扩展到整个仓库时,难题随之而来:数十上百文件、类与函数之间交织着复杂依赖,要从抽象描述落到完整仓库,始终充满挑战。

现有方法多依赖自然语言规划来决定「做什么、怎么做」。这种方式虽直观,却天生模糊、缺乏结构,难以长程稳定地追踪依赖。

结果就是两类常见失效:要么功能提案不全,难以覆盖需求;要么实现过程漂移,接口和模块边界逐渐错乱。

论文地址:https://arxiv.org/abs/2509.16198

为解决这一问题,微软提出了Repository Planning Graph (RPG),以结构化图谱替代脆弱的文字规划,把功能、文件、依赖和数据流统一在一张蓝图中,从而让仓库生成首次具备可控、可扩、可验证的基础。

从需求到仓库的统一蓝图

Repository Planning Graph (RPG)是一种结构化表征,它把仓库生成的全过程统一到一张图里。

RPG的节点可以是功能目标、文件、类或函数,边则显式标注接口调用、依赖关系和数据流动。

这种设计既能回答「要实现什么」(提案层),也能回答「如何实现」(实现层),从而保证高层意图与底层实现的一致性。

ZeroRepo流程概览:(A)提案级构建:将用户需求转化为功能图谱;(B)实现级构建:进一步细化为文件结构和数据流,形成Repository Planning Graph (RPG);(C)图驱动生成:沿拓扑顺序遍历RPG,逐步生成完整仓库。

在此基础上,研究团队提出了ZeroRepo框架。ZeroRepo从用户的自然语言描述出发,分三步逐步构建RPG并在其指导下生成代码:

第一步:提案级构建

ZeroRepo不再让模型「即兴发挥」,而是先把用户的自然语言需求落到RPG上,逐步长成一张功能图谱。

它依托一个庞大的功能树去检索和拼接节点,比如「用户登录」「购物车管理」「支付处理」,像搭积木一样组合成完整蓝图。

这样,系统不但覆盖了所有关键功能,还能保证结构清晰、层次合理。

第二步:实现级构建

有了功能蓝图,还需要明确每个模块「落地到哪里」。

ZeroRepo会把功能节点继续展开,写成具体的文件、接口和数据流,并一一标注进RPG。以「支付处理」为例,它会被拆解成payment_service.py、api/payment_api.py等文件,并明确依赖订单与库存模块的输出。

这样,模块间的边界和依赖被牢牢固定,再也不会在生成过程中走偏。

第三步:图驱动生成

最后,ZeroRepo按照RPG的拓扑顺序推进代码生成。每实现一个文件或函数,就会先生成测试用例,再写函数体,并把结果回写到RPG中。

这形成了「生成—验证—更新」的闭环。

整个过程像是沿着蓝图施工:有规划、有校验,仓库规模不断扩展,但始终保持接口对齐、结构稳定。

实证ZeroRepo:从蓝图到真实仓库

为全面评估仓库级生成能力,他们构建了全新基准RepoCraft。

RepoCraft评估准确性的任务的整体数据收集流程

不同于以往依赖现成仓库或提供详尽文档的设置,RepoCraft不提供完整架构蓝图,还涵盖6个真实项目、共1052个任务:

scikit-learn,pandas,requests,django,statsmodels,sympy。

真正考察模型从模糊需求到结构化实现的能力。

RepoCraft基准上的不同智能体框架与模型性能对比(Gold Projects 代表真实世界的仓库)

功能覆盖与规模:覆盖率达81.5%,比最强基线Claude Code高27.3个点;还能生成超100个新功能(创新率11–13%),远超其他方法。生成仓库平均36K行代码、445K tokens,是Claude Code的3.9倍、其他方法的64倍,复杂度接近人工项目。

正确性与一致性:代码通过率为69.7%,比Claude Code高35.8个点,接近人工项目上限(81%)。RPG的结构化约束有效保证了模块边界和接口设计的一致性,使生成结果更稳定、更贴近设计初衷。

ZeroRepo利用Qwen3-Coder-480B-A35B-Instruct在机器学习库上搭建数据流动和函数依赖示意图

复杂依赖与协同:以Qwen 3 Coder生成的结果来看,RPG不仅清晰组织了文件层次和模块流程,还显式捕捉了跨模块调用与反馈依赖,使复杂关系能够被稳妥管理,仓库在复杂度提升的同时仍保持整体协调。

ZeroRepo随规划迭代次数增长功能数量(左图)和代码数量增长情况

ZeroRepo在功能数与代码规模上都展现出近乎线性的增长趋势。

随着迭代次数增加,RPG引导的规划让新功能和新增代码能够稳步扩展,而不是像基线方法那样在早期就陷入停滞。

这样的线性扩展能力证明他们具备支撑大规模仓库持续开发的潜力。

RPG在智能体定位任务中的加速效果对比(wo/G表示无全局信息)

此外,RPG提供的全局结构视角显著提升了代理的仓库理解与定位能力,使其能够更快地追踪依赖、定位问题并完成模块集成,从而加速整个开发流程。

总结与展望

ZeroRepo展示了结构化图谱在仓库生成中的独特价值:它不仅提升了功能覆盖率、代码规模和正确性,还解决了长期困扰自然语言规划的模糊与漂移问题,使自动化仓库生成首次逼近真实的软件开发过程。

未来,研究团队计划进一步拓展RPG的适用范围,包括支持多轮需求变更下的交互式开发、跨仓库的协同演化,以及与现有工程工具链的深度融合。

参考资料:

https://arxiv.org/abs/2509.16198

相关版本

    多平台下载

    查看所有0条评论>网友评论

    发表评论

    (您的评论需要经过审核才能显示) 网友粉丝QQ群号:766969941

    查看所有0条评论>>

    相关软件
    体育足球bet 世界杯比赛买球 网易 澳门梭哈游戏网站五游下载 K8凯发全站APP 千亿国际游戏登录平台 抢庄牛牛怎么玩儿 凤凰体育登录网页版 ayx爱游戏手机登录 买球平台下载 米乐2022世界杯 体育万博官网多少 球探比分90 ayx官网网页版登录 世界杯投注热度汇总 918娱乐在线 万博全站 线上真钱注册下载 365足球外围官网下载 华体会用不了 蓝湾国际真人娱乐 爱游戏体育手机版下载 必威官网登录网址 cc彩票平台官网 英皇体育官方平台 世界杯买球入口80535 永利贵宾厅网址 BETVlCTOR1946APP 大丰国际彩票平台 ope体育客户端a 乐鱼官方平台下载 日博体育官网 188宝金博官网 二八杠都是对子 千眼体育app下载 博乐棋牌怎么玩 买球网站投注 沙巴体育信誉官方 求真正的365官网 哪款斗地主是赢钱的 贝搏体育账号密码登录 牛牛捡牌规律 澳门九五至尊网上 皇冠官方app怎么下载 世界杯官方指定投注 亚洲赌场有哪些 可靠的体育平台推荐 世界杯在哪买球app 彩神争霸登陆网址 米6体育手机网页 足球比分188直播即时比分 365bet体育滚球官网平台登录 大发国际平台app 澳博体育官方网站 凯发娱乐官网手机版入口 365平台被黑怎么办 和记登路 棋牌直营 亚洲城推荐 马经玄机报(新图推荐) 在哪里买球注世界杯 九州论坛最新网址 沙巴体育手机版登录 沙巴体育客户端首页 188体育平台规则 尊龙登陆 ManBetX万博官网地址最新 世界杯投注app有哪些 365bet体育欧洲 澳门威斯尼斯国际 大三元娱乐城 金沙城中心网站 必赢亚洲官网下载 赌博官方 新皇冠体育 M6电子网投 升博体育app 宝博游戏官网app 实力通天报 升博登录官网 世界杯投注官网查询 365bet体育在线试玩 bte365app下载 188乒乓球比分网即时比分 2026世界杯投注绔v98典tv 澳门葡京赌侠诗 高手解迷 乐鱼苹果app下载 米乐官网 可以玩滚球的网站 体彩彩票官网app下载 亚洲信誉第一网投平台 在哪投注买世界杯球票 欧洲篮球赛事直播 亚美体育平台靠谱 现金网英皇注册开户 真人国际娱乐平台找seo大牛优化网 云顶国际体育下载 永利网站的网址是多少 新皇冠官网app下载苹果 优博网站是什么 ag私网包杀 千赢国际手机版 大富豪平台网站多少 亚博入口登录 体育bob 线上德州平台 世界杯外围足球投注 多宝官网买球 世界杯足彩胜负平投注 永乐官网 凯发游戏 大发app官网下载6.1 网上购彩官方 欧宝注册 开元平台注册送365 188体育下注官网 BET8手机登录网址 贝博平台客户端app 188体育备用网址 新mg官方电子游戏
    热门网络工具