新智元报道
编辑:艾伦
【新智元导读】今天凌晨,Claude Sonnet 4.5发布了!新模型在编码、计算机使用、推理、长任务能力、安全对齐上的水平全面拔高,成为新一代编程模型王者。新一轮围绕编程展开的百模大战即将展开,而Claude Sonnet 4.5即将成为大家争相对标的新对象。
北京时间今天凌晨,Anthropic正式发布了Claude Sonnet 4.5。
这一版本被Claude定义为全球最强的代码模型,同时在智能体构建、计算机使用、推理和数学能力上展现出显著突破。
代码无处不在,它驱动着应用程序、表格和各种工具。
现代工作的核心在于运用这些工具并解决复杂问题,而Sonnet 4.5让这一切更加高效和可靠。
全新功能与产品升级
伴随Sonnet 4.5,Anthropic对Claude全线产品进行了大规模更新:
Claude Code新增了备受期待的「检查点」(Checkpoints)功能,可随时保存进度并一键回滚到早先状态;同时更新了终端界面,并推出了原生VS Code插件。
ClaudeAPI增加了上下文编辑功能和记忆工具,让智能体能运行更久,处理更复杂的任务。
Claude apps现已支持在对话中直接执行代码、生成文件(包括表格、幻灯片和文档)。
Claude for Chrome扩展对此前等待名单中的Max用户开放。
开发者社区也迎来了新的核心资源:Claude AgentSDK。
这套工具包开放了驱动Claude Code的底层基础设施,为所有人打造智能体提供了基础能力。
前沿性能与基准成绩
Sonnet 4.5在多项权威测试中表现出色:
SWE-bench Verified:在真实软件编码能力测试中达到最新的最优水平,可在复杂的多步骤任务中保持超过30小时的专注执行。
OSWorld:在模拟真实计算机任务的基准中,以61.4%的成绩位居首位,而四个月前Sonnet 4还保持在42.2%。
视频演示了Claude for Chrome的模拟操作计算机任务能力
推理与数学:在一系列公共评测中大幅领先,特别是在金融、法律、医学和STEM等专业领域的知识与推理上,远超此前的Opus 4.1。
左右滑动查看
这些进展不仅体现在数据中,也得到了提前体验的专业用户们的高度评价:
Claude Code能自主编程30小时以上,帮助工程师在极短时间内完成原本要花费数月的架构工作。——Sean Ward, iGent AI CEO
replit内部代码编辑测试中,错误率从Sonnet 4的9%直接降至0%。——Michele Catasta, replit President
左右滑动查看
更强的对齐,更安全
Sonnet 4.5是迄今为止对齐性最好的Claude模型。
通过改进的能力和广泛的安全训练,模型在减少迎合、欺骗、权力追求和虚妄鼓励等行为方面取得了明显成效。
在智能体和计算机使用场景中,团队也特别加强了对提示注入攻击的防御。
这些改进已在系统卡(System Card)中以详细评估形式公开,其中首次引入了可解释性技术来验证安全性。
Sonnet 4.5按照AISafety Level 3(ASL-3)框架发布,包含一系列防护措施,例如针对化学、生物、放射和核相关内容的分类器过滤机制。
虽然这些过滤器可能偶尔误判正常内容,但与Sonnet 4相比,误报率已降低十倍,并将在未来继续优化。
Claude Agent SDK
在过去半年中,Claude团队不断迭代Claude Code,探索了智能体设计中的核心挑战,包括长时任务的内存管理、权限体系的平衡,以及子代理的协同方式。
如今,这些能力通过Claude AgentSDK向开发者全面开放。
Claude Agent SDK演示视频
SDK不仅适用于编码,还能支持更广泛的应用场景。
它为构建复杂任务的自主智能体提供了与Anthropic内部工具相同的基础设施。
研究预览:「Imagine with Claude」
作为额外的实验,Anthropic发布了一个临时研究预览——「Imagine with Claude」。
Imagine With Claude实时生成软件演示视频
在这一体验中,Claude会实时生成软件,没有预设功能或预写代码,用户可以直接看到Claude在交互过程中即时创造与适配的过程。
该功能向Max订阅用户开放5天,可在claude.ai/imagine上体验。
API新特性
Sonnet 4.5在API层面也带来了重要更新:
记忆工具(Beta):支持在上下文窗口外存储和调用信息,帮助跨会话维持知识和状态。
上下文编辑:通过自动清理旧的工具调用和结果来避免上下文溢出。
新的停止原因提示:增加了model_context_window_exceeded,更清晰地标识因上下文限制而中止生成。
工具参数改进:修复了字符串参数尾部换行被截断的问题,保证格式精确传递。
Token计数优化:系统会自动添加优化Token,但用户不会为这些系统注入的部分付费。
定价与使用渠道
价格保持与Sonnet 4一致:
输入:3美元/百万Tokens
输出:15美元/百万Tokens
Sonnet 4.5可通过以下渠道使用:
Claude API:claude-sonnet-4-5-20250929
Amazon Bedrock:anthropic.claude-sonnet-4-5-20250929-v1:0
Google Cloud Vertex AI:claude-sonnet-4-5@20250929
同时也在Claude.ai与Claude Code平台上线。
升级指南
当前使用Sonnet 4的开发者,只需将模型名称更新为claude-sonnet-4-5-20250929即可完成迁移。
所有现有API调用依然有效。建议同时启用新特性,例如记忆工具和上下文清理,以充分发挥模型性能。
需要注意的是,Sonnet 4.5不再允许同时指定temperature和top_p参数,用户应选择其一。
新一轮的AI编程大战即将来临
Claude Sonnet 4.5在编码、智能体能力、计算机使用和安全性方面实现了全面跃升。
它既是开发者工具箱中的新利器,也是一个能在金融、医学、科研等领域提供专业支持的强大平台。
Anthropic通过这一版本,继续推动AI在前沿能力和安全性上的平衡发展。
编程新王降临,新一轮围绕编程展开的百模大战即将展开,而Claude Sonnet 4.5即将成为大家争相对标的新对象。
参考资料:
https://www.anthropic.com/news/claude-sonnet-4-5
https://docs.claude.com/en/docs/about-claude/models/whats-new-sonnet-4-5
https://assets.anthropic.com/m/12f214efcc2f457a/original/Claude-Sonnet-4-5-System-Card.pdf
《男女禁禁❌又一爽免费视频》,《P6F3X2M7T9QJ8L1B4WZR》男人的🍌伸到🍑屁股91
“嫦娥三级全黄”
小樱和小狼的肉欲生活
……
09月25日
“张天爱性做爰A片免费看”引她入室
↓↓↓
09月25日,2024横店影视节定档 首届国际影片交易会同步进行,免费看裸体网站黑桃,原神♥禁漫♥天堂♥,成人性生交大片免费看A片狼牙,茄子视频成人♥免费观看
09月25日,贵州省政协委员刘大泯:“贵州苗画”是中国民族民间艺术不可或缺的品类,美女裸体㊙️洗澡全过程免费挤奶,高潮h跪趴扩张调教男男视频,韩国裸体免费的,女人的隐私㊙️祼🐻视频
09月25日,促进企业通关便利 海关总署推出十六条措施,国产⭐浪潮AV性色Av小说,女帝被扒开腿爆乳液狂飙,动漫🚫18涩涩动漫人物,警官解开警裤裸J自慰
09月25日|推动经济实现良性循环 今年扩内需如何发力?|消防员吃武警大吉吧|MM131妲己被❌喷水|美女开叉露胸内衣|雏田爆乳被❌🔞漫画
09月25日|应急管理部派工作组赴深圳工地坍塌事故现场|Porno95😍😍|国产精品㊙️精品3D漫画|揉我奶头啊嗯小雪电影|masterpieces第1~3集
09月25日|3D打印药膜能“剿灭”癌细胞|18🈲视频❌❌❌两年半|www深夜成人a√在线|好硬好大18男自慰免费看|无遮挡黄H漫画欲漫涩下载……
09月25日,呼吁行业多些耐心 中国科技精英共话AI如何转化为新质生产力,福瑞男同gv🔞禁网站,欧美顶级meter自慰裸体,国产美女爆乳娇喘呻吟视频,教官解开裤裆吃我j男男小说
09月25日,五部门:持续推进农村危房改造和抗震改造,二次元强❌乳喷自慰无码爽,海贼王罗宾裸体❌同人软件,啊轻点灬大巴太粗太长了小熊,宝贝⋯腿张大点就不疼了男女
09月25日|海南自贸港“零关税”进口货值近200亿元|高清🔞❌♋破解版91|朴妮唛三级露全乳视频|成人门🔞性视频免费站|3Dmax斗破苍穹黄化版
09月25日,2月份中国各种自然灾害致652万人次受灾,少女的惩罚游戏2.0版本更新内容,公交车强摁做开腿呻吟H小燕子,美女裸体❌开腿短视频,美女被❌到爽🔞高潮蓝莓视频
09月25日,山东强化今冬明春防灭火工作 护航经济社会高质量发展,缅甸变态残虐特级A片,性裸交直播,短篇辣肉黄辣放荡高H文动漫,刺客伍六七❌18同人禁网站
09月25日,新能源车市呈现“三国杀”格局,传统车企、新势力与“手机帮”角逐市场,SDMM—054魔镜号,温迪同人H污本子网站,少萝吃大狙最后去哪了,天堂视频在线观看✅
09月25日|公务交往、街头搭讪!国家安全部披露境外间谍情报机关惯用伎俩|18❌❌❌奶头有奶水|男生边吃边c小电影|高潮国产喷水白|揉我奶⋯啊⋯嗯高潮孕妇电影
09月25日|国际最新研究:一种新方法制作智能纤维 可用于可穿戴电子设备|调教打屁股惩罚(SP)系列文|巨胸爆乳露双奶头被的网站|舌头伸进去的我好爽动漫|DVA扒开胸罩㊙️露出奶头8
09月25日|腾龙“飞”入博物馆 浙江嘉兴汉画明瓦迎新春|all空被男肉H|边添小泬边狠狠躁视频樱桃|操鸡视频|性瘾大总裁被c呻吟双腿大张bl
怎么没人通知川渝出伏,营造和平发展的国际环境|探访首届中国新疆民间艺术季|赵露思裸乳被爆❌ai|蜜桃视频成人AV在线观看|掀开奶罩边躁狠狠躁学生小说男男|国产成人久久爽AAA片野外
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺