刚刚,Claude Sonnet 4.5重磅发布,编程新王降临!
新智元报道
编辑:艾伦
【新智元导读】今天凌晨,Claude Sonnet 4.5发布了!新模型在编码、计算机使用、推理、长任务能力、安全对齐上的水平全面拔高,成为新一代编程模型王者。新一轮围绕编程展开的百模大战即将展开,而Claude Sonnet 4.5即将成为大家争相对标的新对象。
北京时间今天凌晨,Anthropic正式发布了Claude Sonnet 4.5。
这一版本被Claude定义为全球最强的代码模型,同时在智能体构建、计算机使用、推理和数学能力上展现出显著突破。
代码无处不在,它驱动着应用程序、表格和各种工具。
现代工作的核心在于运用这些工具并解决复杂问题,而Sonnet 4.5让这一切更加高效和可靠。
全新功能与产品升级
伴随Sonnet 4.5,Anthropic对Claude全线产品进行了大规模更新:
Claude Code新增了备受期待的「检查点」(Checkpoints)功能,可随时保存进度并一键回滚到早先状态;同时更新了终端界面,并推出了原生VS Code插件。
ClaudeAPI增加了上下文编辑功能和记忆工具,让智能体能运行更久,处理更复杂的任务。
Claude apps现已支持在对话中直接执行代码、生成文件(包括表格、幻灯片和文档)。
Claude for Chrome扩展对此前等待名单中的Max用户开放。
开发者社区也迎来了新的核心资源:Claude AgentSDK。
这套工具包开放了驱动Claude Code的底层基础设施,为所有人打造智能体提供了基础能力。
前沿性能与基准成绩
Sonnet 4.5在多项权威测试中表现出色:
SWE-bench Verified:在真实软件编码能力测试中达到最新的最优水平,可在复杂的多步骤任务中保持超过30小时的专注执行。
OSWorld:在模拟真实计算机任务的基准中,以61.4%的成绩位居首位,而四个月前Sonnet 4还保持在42.2%。
视频演示了Claude for Chrome的模拟操作计算机任务能力
推理与数学:在一系列公共评测中大幅领先,特别是在金融、法律、医学和STEM等专业领域的知识与推理上,远超此前的Opus 4.1。
左右滑动查看
这些进展不仅体现在数据中,也得到了提前体验的专业用户们的高度评价:
Claude Code能自主编程30小时以上,帮助工程师在极短时间内完成原本要花费数月的架构工作。——Sean Ward, iGent AI CEO
replit内部代码编辑测试中,错误率从Sonnet 4的9%直接降至0%。——Michele Catasta, replit President
左右滑动查看
更强的对齐,更安全
Sonnet 4.5是迄今为止对齐性最好的Claude模型。
通过改进的能力和广泛的安全训练,模型在减少迎合、欺骗、权力追求和虚妄鼓励等行为方面取得了明显成效。
在智能体和计算机使用场景中,团队也特别加强了对提示注入攻击的防御。
这些改进已在系统卡(System Card)中以详细评估形式公开,其中首次引入了可解释性技术来验证安全性。
Sonnet 4.5按照AISafety Level 3(ASL-3)框架发布,包含一系列防护措施,例如针对化学、生物、放射和核相关内容的分类器过滤机制。
虽然这些过滤器可能偶尔误判正常内容,但与Sonnet 4相比,误报率已降低十倍,并将在未来继续优化。
Claude Agent SDK
在过去半年中,Claude团队不断迭代Claude Code,探索了智能体设计中的核心挑战,包括长时任务的内存管理、权限体系的平衡,以及子代理的协同方式。
如今,这些能力通过Claude AgentSDK向开发者全面开放。
Claude Agent SDK演示视频
SDK不仅适用于编码,还能支持更广泛的应用场景。
它为构建复杂任务的自主智能体提供了与Anthropic内部工具相同的基础设施。
研究预览:「Imagine with Claude」
作为额外的实验,Anthropic发布了一个临时研究预览——「Imagine with Claude」。
Imagine With Claude实时生成软件演示视频
在这一体验中,Claude会实时生成软件,没有预设功能或预写代码,用户可以直接看到Claude在交互过程中即时创造与适配的过程。
该功能向Max订阅用户开放5天,可在claude.ai/imagine上体验。
API新特性
Sonnet 4.5在API层面也带来了重要更新:
记忆工具(Beta):支持在上下文窗口外存储和调用信息,帮助跨会话维持知识和状态。
上下文编辑:通过自动清理旧的工具调用和结果来避免上下文溢出。
新的停止原因提示:增加了model_context_window_exceeded,更清晰地标识因上下文限制而中止生成。
工具参数改进:修复了字符串参数尾部换行被截断的问题,保证格式精确传递。
Token计数优化:系统会自动添加优化Token,但用户不会为这些系统注入的部分付费。
定价与使用渠道
价格保持与Sonnet 4一致:
输入:3美元/百万Tokens
输出:15美元/百万Tokens
Sonnet 4.5可通过以下渠道使用:
Claude API:claude-sonnet-4-5-20250929
Amazon Bedrock:anthropic.claude-sonnet-4-5-20250929-v1:0
Google Cloud Vertex AI:claude-sonnet-4-5@20250929
同时也在Claude.ai与Claude Code平台上线。
升级指南
当前使用Sonnet 4的开发者,只需将模型名称更新为claude-sonnet-4-5-20250929即可完成迁移。
所有现有API调用依然有效。建议同时启用新特性,例如记忆工具和上下文清理,以充分发挥模型性能。
需要注意的是,Sonnet 4.5不再允许同时指定temperature和top_p参数,用户应选择其一。
新一轮的AI编程大战即将来临
Claude Sonnet 4.5在编码、智能体能力、计算机使用和安全性方面实现了全面跃升。
它既是开发者工具箱中的新利器,也是一个能在金融、医学、科研等领域提供专业支持的强大平台。
Anthropic通过这一版本,继续推动AI在前沿能力和安全性上的平衡发展。
编程新王降临,新一轮围绕编程展开的百模大战即将展开,而Claude Sonnet 4.5即将成为大家争相对标的新对象。
参考资料:
https://www.anthropic.com/news/claude-sonnet-4-5
https://docs.claude.com/en/docs/about-claude/models/whats-new-sonnet-4-5
https://assets.anthropic.com/m/12f214efcc2f457a/original/Claude-Sonnet-4-5-System-Card.pdf
万博网页手机版
宝博体育平台
金沙快速登陆
电子游戏娱乐平台网址
银河最新官方网址娱乐平台登录
威尼斯人平台网页版官网
伟德体育平台网址
博狗在线买球
通缉令-1(老版)
188体育官网是多少
3d在线缩水
bibo必博体育
如何在网上投注彩票
十大真钱平台
百姓彩票官网网址
和记娱乐手机APP
sbf888网站
体球直播
另翡翠秘笈
千赢国际手游官网
在线真金赌场
伟德游戏怎么注册
九州体育官网
365bet网球比分
大发体育在线开户
杏彩旗下平台
普京新网址
电子pg游戏辅助软件
足球外围规则
菲律宾亚星注册
利奥彩票平台注册
188金宝搏安全吗
银河国际手机app下载
ebet平台
星速app在线下载
正规赌场
188BETAPP
多宝体育推荐
金沙线上赌博注册
博乐官网棋牌
天天斗牛最新版本
沙巴体育手机
kb88凯时
足球直播
鸿运938777n
澳门白宫真人ag
澳门冠皇
365官网登录
澳门线上真人app大全
金沙游乐场官网
天亚娱乐官网网址
万博赞助狼队
pg电子免费版
金沙外围官网
百老汇在线买球
体育平台被黑了怎么办
捕鱼能下分的
线上在哪可以买彩票
明升体育官方下载
葡京牛牛
亚星登录网址
亚娱体育全站
亚星官网登陆
六合圣旨
qy30千赢国际
天博平台下载
im电竞手机版
bet8官网登录入口
bet9网址
天博官方网站app
威尼斯人登陆官网
球探分析开户
edf一定发手机版
云鼎国际
送体验金网站
m8米博体育有谁玩过
正规葡京官网
mg游戏官网在线平台
葡京体育真人百家乐
网信快3正规平台
王者体育网页版官网
网友评论 查看所有评论>>