闻乐 发自 凹非寺量子位 | 公众号 QbitAI
编程模型最新卷王来了。
就在今天,火山引擎推出了面向Agentic编程任务深度优化的全新代码模型Doubao-Seed-Code
三个不同的维度,卷出了新高度。
第一,性能SOTA,与TRAE开发环境深度结合后,能更快、更准地解决问题,登顶了SWE-Bench Verified榜单。
第二,价格,调用价格国内最低,火山引擎还配套推出9块9套餐,一杯咖啡钱,就能搞定各种摸鱼小游戏——比如办公室躲老板(doge)。
最后,迁移成本——Doubao-Seed-Code原生兼容Anthropic API,在Claude Code环境中进行迁移,都不用做复杂的配置,几乎就是零成本切换。
不过说归说闹归闹,最后还得看实测效果。
咱实测一波看看……
实测Doubao-Seed-Code
老样子,Coding测试,咱先设置几个进阶任务,看看能力究竟几斤几两。
首先是基础功能,然后交互优化,接着工程化重构,最后完整网站设计
逻辑上层层递进,难度上从单一视觉实现到复杂问题解决,逐步考验Doubao-Seed-Code的综合能力。
第一阶段聚焦简单任务,看看它的基础视觉效果实现能力。
请帮我创建一个银河系粒子效果动画。要求:1)使用Canvas绘制粒子系统;2)粒子随机分布在画布上,模拟星空效果;3)粒子有不同的大小和亮度,模拟远近不同的星星;4)添加鼠标交互,鼠标移动时粒子会有轻微的响应;5)背景使用深色渐变,营造宇宙深邃感。请使用HTML5 Canvas和JavaScript实现。
这个任务的核心需求单一,没有复杂的交互,模型耗时1分多钟输出完整的HTML5 Canvas+JS代码,运行后粒子随机分布,大小与亮度差异也确实能体现远近感,和鼠标交互的轻微响应也能get。
结果很不错,能快速完成简单视觉任务,技术栈使用准确且基础功能无偏差。
紧接着,验证一下模型对“视觉风格+复杂交互逻辑”的理解与优化能力。
这次在Claude Code里进行API调用,不得不夸一句,“无缝衔接”真丝滑,就这个API原生兼容爽!
实际上也不止Claude Code,Doubao-Seed-Code在Cursor、Cline、Codex CLI等主流智能编程环境里,都能与开发者们日常使用的工具无缝衔接。
完整html,Minecraft风格,展示拉链形状,当我上下移动鼠标时,拉链会像真实的拉链一样打开和关闭。拉链闭合拉开的速度慢点。要求:禁止使用任何改变应用结构或组件化范式的JavaScript 框架/库(例如:React,Vue,Angular)。可以cdn引用第三方库以满足题目要求,如Three.js,p5js。最终产物必须是纯粹的HTML、CSS和JS文件。如果需要创建多个文件(HTML/CSS/JS),请确保所有文件引用均使用相对路径。
任务是开发Minecraft风格拉链交互效果,相比第一阶段增加了“鼠标上下移动控制拉链开合(速度慢)” 的交互要求。
模型第一次做完项目倒是非常贴心地帮忙检查了运行效果,也给了一些速度修改建议。
Minecraft风格是有了、拉链形状也有了,但这个交互方式,怎么看也不像拉链啊……
是不是提示的问题,那咱再进一步改造一下:
这个交互模式不像现实生活中的拉链
很快就找到了问题所在,定位到交互逻辑与现实场景脱节的核心问题。
一次改造后的效果如下:
虽然第一次没完成,但调整起来效率尚可,在多轮交互时响应也还算丝滑。
下面,咱来看看Doubao-Seed-Code解决工程化问题的能力,给它给一份旧代码,让它找bug并且进行项目重构。
测试素材是一份有多个问题的记事本项目。
(提供文件)定位这份代码的bug,并进行结构化重构
Doubao-Seed-Code拿到任务后先是明确了旧代码的问题,将Bug定位到了具体的代码行。
随后输出重构代码,还列出了优化清单。
对比两份代码,从菜单创建模块可以看出,左边旧代码结构混乱,并且没有分离设计,重构后的代码拆分了菜单与文件操作模块,并且绑定了快捷键。
具体到某个函数,比如打开文件夹模块,左边旧代码中文内容乱码,没有进行文件不存在的异常处理,新代码都进行了改善。
可以看出模型面对“多Bug+结构混乱”的复杂工程问题时,具备系统性诊断与专业重构的能力。
最后进行完整项目开发,测试模型对多需求整合与落地的能力。
帮我开发一个故宫博物院的导览网站。需要包含几个主要宫殿的介绍,配上高清的馆藏文物图片。最重要的是,每个宫殿的介绍页面,都要有一个语音导览按钮,点击后能播放由AI生成的专业语音解说。
由于没有提前提供素材,模型在交付的代码中主动补充了图片替换教程,详细说明如何按需搜索素材并替换占位图,解决了素材缺失的问题。
从最终效果来看,网站结构完整,涵盖了核心功能模块,语音导览按钮的逻辑也已预留,并且实现了完整功能。
同时还考虑到了实际使用中的素材问题,不得不说,全面~
等一下,好像还有更有意思的事情,Doubao-Seed-Code居然能看图写代码
现阶段,只有Claude系列、GPT-4V等一些国外模型能够参考UI设计稿或截图生成代码。
Doubao-Seed-Code要是能做到,那真是国产编程模型独一份了。
马上来试试!先提供一个“移动端咖啡点单页面”的UI设计稿:
(提供UI设计稿)请参考给出的UI设计稿图片,生成一个“移动端咖啡点单页面”,生成满足所有要求的前端代码,确保页面主题明确。
点餐页面就这么水灵灵的做出来了,相似度99%!
那另外的1%去哪了?
原来是为了避免素材依赖,Doubao-Seed-Code给画了个和原图不太一样的咖啡杯(hhh
这只能说,「图片在手,UI我有」了。
整体测完后,Doubao-Seed-Code的实测效果,确实符合官方强调的优势特点——
国内首个支持视觉理解能力的编程模型,能够参照UI设计稿、界面截图或手绘草图直接生成对应代码;同时,还能对已生成的页面进行视觉比对,主动识别样式偏差与功能Bug,并自主完成修复优化,显著提升了前端开发效率;原生兼容Anthropic API。对于广大使用Claude Code的开发者,几乎零成本即可将API切换到Doubao-Seed-Code。多平台适配,还对Claude Code、Trae等主流IDE进行了特别优化;原生256K长上下文,在处理长代码文件、多模块依赖等复杂场景能力提升,实现端到端自主编程,全栈开发友好,前端能力突出;
当然,性能上的优势之外,火山引擎在AI大模型浪潮中给人的最大印象,还得是稳定又便宜。
模型够强,保障够硬,价格够低
AI Coding愈发竞争激烈,各厂商纷纷发力卷性能卷价格卷使用保障,火山引擎也不遑多让。
最最最受关切的成本问题,也被火山引擎打到了“一杯咖啡价”。
综合使用成本在业界平均水平上砍了62.7%,在调用价格上,不仅比国际主流模型低得多,还卷到了国内最低价:
0-32k输入区间:输入1.20元/百万Token,输出8.00元/百万Token32-128k输入区间:输入1.40元/百万Token,输出12.00元/百万Token128-256k输入区间:输入2.80元/百万Token,输出16.00元/百万Token
打个比方,要创建一个美观的交互式英语学习网站,在0-32k区间的相同tokens量下,Claude Sonnet 4.5的成本约4.05元,GLM-4.6约0.77元,而Doubao-Seed-Code仅约0.34元
这不刚好双11,火山引擎还给个人开发者安排了省钱大礼包,推出了支持最新模型的Coding Plan,最低套餐首月仅需9.9元。
火山引擎自投身编程模型研发以来,从早期版本的逐步迭代,到推出如豆包大模型系列,在编程能力上可以说是持续进化。
开源了命令行AI Agent——veCLI,通过自然语言交互,实现从指令到代码的自动化构建与运行。
还基于编程相关模型打造了IDE产品TRAE 。如今,在字节内部,超过80%的工程师都在使用TRAE辅助开发,其整体月活用户已超100万。
现下,Doubao-Seed-Code和TRAE的组合拳更是有亮眼表现,在SWE-Bench-Verified基准上“卷”到了SOTA。
Doubao-Seed-Code在Terminal Bench、SWE-Bench-Verified-Openhands、Multi-SWE-Bench-Flash-Openhands等主流测评也表现出色,在国内同赛道模型中表现突出。
表现如此,离不开背后的技术支撑优化。
这次,火山引擎为Doubao-Seed-Code构建了覆盖10万容器镜像的庞大训练库,支持端到端沙盒环境评测;依托千卡GPU集群,实现了万级并发沙盒session能力。
采用端到端强化学习,直接从任务沙盒反馈中学习,不用依赖复杂的蒸馏过程,优化路径也更高效。
另外,火山引擎还在算力和安全保障上,做了进一步加码。
背靠火山引擎的超大资源池,即便遇到多用户并行调用、复杂项目开发等高频场景,也能保持稳定响应。
同时,模型由火山方舟提供推理接口服务,代码数据传输和调用过程全程加密,不用担心核心开发信息泄露。
可以说把企业级AI开发,痛点都琢磨得透透的了。
不愧是宇宙厂自己先用先检验的产品和技术。
AI coding正进入了“一杯咖啡”时代,而且还是一杯国产咖啡价格的时代。
想要薅这个羊毛,复制下方链接即可传送~
Coding Plan订阅:https://www.volcengine.com/activity/codingplan?utm_campaign=202511&utm_content=codingplan&utm_medium=waibumeiti_jigou&utm_source=VolcanoArk&utm_term=liangziwei
— 完 —
《金沙网上网站》,《Q8X2R7L1T4J5M9B6W3》存送百分百活动
“葡萄京娱乐场网上平台”
华体会网投
……
11月08日
“c7娱乐下载”财政部:去年不存在财政支出收缩
↓↓↓
11月08日,大小莲花奥体中心全民健身场地再次开放 还馆于民,mile811,皇冠滚球app下载,球球体育官网入口,澳门凤凰版网站
11月08日,网红因感冒导致重度肺炎去世!如何判断感冒与肺炎?,体育平台被黑了怎么办,188betasia,世界杯怎么买球?,世界杯在哪买球投注
11月08日,“歪果仁”探访世界最大玛尼石堆 体验玛尼石刻,betway必威,银河国际客户端官网,德赢体育官网登录,188宝金博体育APP
11月08日|“桃王”来啦!河北深州上演“桃王争霸赛”|凯发娱乐全站网页版登录|黄大仙救世|b0b体育app真的吗|贝博bb平台体育app下载
11月08日|儿童孤独症怎么发现?如何治疗?探访安徽首个儿童发育行为中心|澳门百老汇会员注册|真人国际娱乐赌场|在线试玩电子游戏平台|申博官网买球
11月08日|台湾青年列席福建政协会议 参与感提升|威尼斯人登录和注册|必威官网登陆|龙8国际快速开户|万博官方网站登录……
11月08日,四大趋势显现,今年的楼市很关键!,打现金的德州app,Bet足球比分,皇冠登录页面,万博娱乐官网
11月08日,首届外交官非遗盛典为世界文明交流互鉴搭建国际舞台,开娱棋牌,完美体育365WM平台官网,爱游戏电竞app下载安装,视讯真人游戏网页版
11月08日|京杭大运河首批新能源智能商品船在山东邹城下水|赌神兔报|八方资源网官网登陆|三张扎金花安卓下载|ag厅真的吗
11月08日,近期全国降雨“面弱点强” 什么原因?如何应对?,电竞游戏比分网,aoa体育在线登录首页,下载金沙娱场城网址,博狗世界杯买球
11月08日,海南:2027年形成高密度商业发射能力,云顶外围官网,有什么玩球平台,KU游娱乐登录平台页面,百老汇官网app下载安卓版
11月08日,受降雪及路面结冰影响 全国多地共封闭路段162个 关闭收费站188个,kok直播视讯,k8娱乐网址下载,千赢国际qy88vip手机,亿博官网
11月08日|港铁庆祝通车45周年 李家超赞其为世界顶尖交通系统之一|2026世界杯投注级v98典tv|芒果体育平台合法吗|我才是棋牌旧版|线上娱乐平台大全
11月08日|在热议AI时看见农村|斗地主换现金|星际娱乐场网址多少|体彩网上投注站app|亚美体育登录网页
11月08日|安徽祁门:丝光椋鸟正成长|12bet官网登录|网络电子娱乐|银河国际手机版下载官网|38手游在线客服
甜蜜家园3,指纹前女友|两会大家谈|激活新质生产力 新加坡学者看好中国经济高质量发展|赢家体育app|真钱赌手机注册|bbin网址|美高梅现金排名
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺