闻乐 发自 凹非寺量子位 | 公众号 QbitAI
编程模型最新卷王来了。
就在今天,火山引擎推出了面向Agentic编程任务深度优化的全新代码模型Doubao-Seed-Code
三个不同的维度,卷出了新高度。
第一,性能SOTA,与TRAE开发环境深度结合后,能更快、更准地解决问题,登顶了SWE-Bench Verified榜单。
第二,价格,调用价格国内最低,火山引擎还配套推出9块9套餐,一杯咖啡钱,就能搞定各种摸鱼小游戏——比如办公室躲老板(doge)。
最后,迁移成本——Doubao-Seed-Code原生兼容Anthropic API,在Claude Code环境中进行迁移,都不用做复杂的配置,几乎就是零成本切换。
不过说归说闹归闹,最后还得看实测效果。
咱实测一波看看……
实测Doubao-Seed-Code
老样子,Coding测试,咱先设置几个进阶任务,看看能力究竟几斤几两。
首先是基础功能,然后交互优化,接着工程化重构,最后完整网站设计
逻辑上层层递进,难度上从单一视觉实现到复杂问题解决,逐步考验Doubao-Seed-Code的综合能力。
第一阶段聚焦简单任务,看看它的基础视觉效果实现能力。
请帮我创建一个银河系粒子效果动画。要求:1)使用Canvas绘制粒子系统;2)粒子随机分布在画布上,模拟星空效果;3)粒子有不同的大小和亮度,模拟远近不同的星星;4)添加鼠标交互,鼠标移动时粒子会有轻微的响应;5)背景使用深色渐变,营造宇宙深邃感。请使用HTML5 Canvas和JavaScript实现。
这个任务的核心需求单一,没有复杂的交互,模型耗时1分多钟输出完整的HTML5 Canvas+JS代码,运行后粒子随机分布,大小与亮度差异也确实能体现远近感,和鼠标交互的轻微响应也能get。
结果很不错,能快速完成简单视觉任务,技术栈使用准确且基础功能无偏差。
紧接着,验证一下模型对“视觉风格+复杂交互逻辑”的理解与优化能力。
这次在Claude Code里进行API调用,不得不夸一句,“无缝衔接”真丝滑,就这个API原生兼容爽!
实际上也不止Claude Code,Doubao-Seed-Code在Cursor、Cline、Codex CLI等主流智能编程环境里,都能与开发者们日常使用的工具无缝衔接。
完整html,Minecraft风格,展示拉链形状,当我上下移动鼠标时,拉链会像真实的拉链一样打开和关闭。拉链闭合拉开的速度慢点。要求:禁止使用任何改变应用结构或组件化范式的JavaScript 框架/库(例如:React,Vue,Angular)。可以cdn引用第三方库以满足题目要求,如Three.js,p5js。最终产物必须是纯粹的HTML、CSS和JS文件。如果需要创建多个文件(HTML/CSS/JS),请确保所有文件引用均使用相对路径。
任务是开发Minecraft风格拉链交互效果,相比第一阶段增加了“鼠标上下移动控制拉链开合(速度慢)” 的交互要求。
模型第一次做完项目倒是非常贴心地帮忙检查了运行效果,也给了一些速度修改建议。
Minecraft风格是有了、拉链形状也有了,但这个交互方式,怎么看也不像拉链啊……
是不是提示的问题,那咱再进一步改造一下:
这个交互模式不像现实生活中的拉链
很快就找到了问题所在,定位到交互逻辑与现实场景脱节的核心问题。
一次改造后的效果如下:
虽然第一次没完成,但调整起来效率尚可,在多轮交互时响应也还算丝滑。
下面,咱来看看Doubao-Seed-Code解决工程化问题的能力,给它给一份旧代码,让它找bug并且进行项目重构。
测试素材是一份有多个问题的记事本项目。
(提供文件)定位这份代码的bug,并进行结构化重构
Doubao-Seed-Code拿到任务后先是明确了旧代码的问题,将Bug定位到了具体的代码行。
随后输出重构代码,还列出了优化清单。
对比两份代码,从菜单创建模块可以看出,左边旧代码结构混乱,并且没有分离设计,重构后的代码拆分了菜单与文件操作模块,并且绑定了快捷键。
具体到某个函数,比如打开文件夹模块,左边旧代码中文内容乱码,没有进行文件不存在的异常处理,新代码都进行了改善。
可以看出模型面对“多Bug+结构混乱”的复杂工程问题时,具备系统性诊断与专业重构的能力。
最后进行完整项目开发,测试模型对多需求整合与落地的能力。
帮我开发一个故宫博物院的导览网站。需要包含几个主要宫殿的介绍,配上高清的馆藏文物图片。最重要的是,每个宫殿的介绍页面,都要有一个语音导览按钮,点击后能播放由AI生成的专业语音解说。
由于没有提前提供素材,模型在交付的代码中主动补充了图片替换教程,详细说明如何按需搜索素材并替换占位图,解决了素材缺失的问题。
从最终效果来看,网站结构完整,涵盖了核心功能模块,语音导览按钮的逻辑也已预留,并且实现了完整功能。
同时还考虑到了实际使用中的素材问题,不得不说,全面~
等一下,好像还有更有意思的事情,Doubao-Seed-Code居然能看图写代码
现阶段,只有Claude系列、GPT-4V等一些国外模型能够参考UI设计稿或截图生成代码。
Doubao-Seed-Code要是能做到,那真是国产编程模型独一份了。
马上来试试!先提供一个“移动端咖啡点单页面”的UI设计稿:
(提供UI设计稿)请参考给出的UI设计稿图片,生成一个“移动端咖啡点单页面”,生成满足所有要求的前端代码,确保页面主题明确。
点餐页面就这么水灵灵的做出来了,相似度99%!
那另外的1%去哪了?
原来是为了避免素材依赖,Doubao-Seed-Code给画了个和原图不太一样的咖啡杯(hhh
这只能说,「图片在手,UI我有」了。
整体测完后,Doubao-Seed-Code的实测效果,确实符合官方强调的优势特点——
国内首个支持视觉理解能力的编程模型,能够参照UI设计稿、界面截图或手绘草图直接生成对应代码;同时,还能对已生成的页面进行视觉比对,主动识别样式偏差与功能Bug,并自主完成修复优化,显著提升了前端开发效率;原生兼容Anthropic API。对于广大使用Claude Code的开发者,几乎零成本即可将API切换到Doubao-Seed-Code。多平台适配,还对Claude Code、Trae等主流IDE进行了特别优化;原生256K长上下文,在处理长代码文件、多模块依赖等复杂场景能力提升,实现端到端自主编程,全栈开发友好,前端能力突出;
当然,性能上的优势之外,火山引擎在AI大模型浪潮中给人的最大印象,还得是稳定又便宜。
模型够强,保障够硬,价格够低
AI Coding愈发竞争激烈,各厂商纷纷发力卷性能卷价格卷使用保障,火山引擎也不遑多让。
最最最受关切的成本问题,也被火山引擎打到了“一杯咖啡价”。
综合使用成本在业界平均水平上砍了62.7%,在调用价格上,不仅比国际主流模型低得多,还卷到了国内最低价:
0-32k输入区间:输入1.20元/百万Token,输出8.00元/百万Token32-128k输入区间:输入1.40元/百万Token,输出12.00元/百万Token128-256k输入区间:输入2.80元/百万Token,输出16.00元/百万Token
打个比方,要创建一个美观的交互式英语学习网站,在0-32k区间的相同tokens量下,Claude Sonnet 4.5的成本约4.05元,GLM-4.6约0.77元,而Doubao-Seed-Code仅约0.34元
这不刚好双11,火山引擎还给个人开发者安排了省钱大礼包,推出了支持最新模型的Coding Plan,最低套餐首月仅需9.9元。
火山引擎自投身编程模型研发以来,从早期版本的逐步迭代,到推出如豆包大模型系列,在编程能力上可以说是持续进化。
开源了命令行AI Agent——veCLI,通过自然语言交互,实现从指令到代码的自动化构建与运行。
还基于编程相关模型打造了IDE产品TRAE 。如今,在字节内部,超过80%的工程师都在使用TRAE辅助开发,其整体月活用户已超100万。
现下,Doubao-Seed-Code和TRAE的组合拳更是有亮眼表现,在SWE-Bench-Verified基准上“卷”到了SOTA。
Doubao-Seed-Code在Terminal Bench、SWE-Bench-Verified-Openhands、Multi-SWE-Bench-Flash-Openhands等主流测评也表现出色,在国内同赛道模型中表现突出。
表现如此,离不开背后的技术支撑优化。
这次,火山引擎为Doubao-Seed-Code构建了覆盖10万容器镜像的庞大训练库,支持端到端沙盒环境评测;依托千卡GPU集群,实现了万级并发沙盒session能力。
采用端到端强化学习,直接从任务沙盒反馈中学习,不用依赖复杂的蒸馏过程,优化路径也更高效。
另外,火山引擎还在算力和安全保障上,做了进一步加码。
背靠火山引擎的超大资源池,即便遇到多用户并行调用、复杂项目开发等高频场景,也能保持稳定响应。
同时,模型由火山方舟提供推理接口服务,代码数据传输和调用过程全程加密,不用担心核心开发信息泄露。
可以说把企业级AI开发,痛点都琢磨得透透的了。
不愧是宇宙厂自己先用先检验的产品和技术。
AI coding正进入了“一杯咖啡”时代,而且还是一杯国产咖啡价格的时代。
想要薅这个羊毛,复制下方链接即可传送~
Coding Plan订阅:https://www.volcengine.com/activity/codingplan?utm_campaign=202511&utm_content=codingplan&utm_medium=waibumeiti_jigou&utm_source=VolcanoArk&utm_term=liangziwei
— 完 —
《欧洲足球平台》,《Q8X2R7L1T4J5M9B6W3》kok手机登录
“优博注册彩金”
亚博平台网址
……
11月11日
“最新手机捕鱼上下分”新闻联播主播海霞成中传博导
↓↓↓
11月11日,2024年尾波滑水世锦赛决赛在浙江杭州举行,哪个软件可以玩抢庄牛牛,银河国际官方app,仙机点特(新图),beat365在线登录
11月11日,中国气象局启动暴雨三级应急响应,篮球投注app哪个好,M6体育下载,港彩连连中,乐虎国际在哪开户
11月11日,内蒙古首次开展无人机悬挂金属球标校天气雷达试验,和真人下国际象棋,在线试玩电子游戏平台,三公游戏,longhair网站
11月11日|在长春见青春!长春假日游线上线下玩到爆!|爱博官方下载|凯时平台注册网址|国际沙巴官网开户|正规app买球
11月11日|海南省军区某部参谋高海超:多下苦功夫,关键时刻才能顶得上|必威快速登陆|manbetx官网官方网站|欧宝官网在线登录|万博娱乐官网
11月11日|马识途110岁生日:泼墨送福寿 聚餐“打平伙”|澳门金沙平台娱乐场|葡萄牙赌场官网|封神榜国际版元魂真人|博天堂入口……
11月11日,大熊猫国家公园四川片区拿到“户口簿”,银河电子游戏登录网站,真人平台注册,菠菜平台大全,永乐国际勇往直前的路上
11月11日,辽宁大连:“爱伴导盲犬”主题航班活动举行,hjcvip黄金城,现金赌场手游下载,还有什么APP可以玩德州,dafa888下载客户端
11月11日|漫评美所谓“国家安全”之一:“留学生也不放过”|明博体育娱乐|果博手机版|米乐快速注册|盘口赔率世界杯投注
11月11日,万元“现金鲜花”送女友图个浪漫?当心成新型洗钱“帮凶”,188体育外围注册,线上信誉葡京,皇冠游戏官网,尊龙d88用现备用
11月11日,超7500吨 我国最大海上智能油田群日产量创新高,国际真人秀直插间,开元棋牌官网最新,极跃体育官方网站,九游会可靠吗
11月11日,“顺德新港——海南洋浦港”内外贸同船班轮航线开通,188bet官网登录,bbin体育官方网站,必威登陆平台,国际AG旗舰厅
11月11日|中方:正密切关注孟加拉国局势 望早日恢复社会稳定|牛宝体育开户网址|威尼斯人网站登录|亚美体育黑款吗|纬来体育备用网址
11月11日|违法违规涉军自媒体账号典型案例|大发888免费试玩|bet36网站靠谱吗|打鱼注册送200|凯发一触即发
11月11日|今年前10月上海海关以加工贸易方式监管出口船舶金额增近六成|2026世界杯视频网站|摩天城体育|hth华体会app平台|2026年世界杯决赛买球
考研数学被评最佳睡前读物,萝莉岛受害女孩曾计划游泳逃跑|迄今最高能效量子点太阳能电池面世|稳定的足球外围网站|实博娱乐|必威手机下载版|联合早报首页
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺