刚刚,Claude Sonnet 4.5重磅发布,编程新王降临!
新智元报道
编辑:艾伦
【新智元导读】今天凌晨,Claude Sonnet 4.5发布了!新模型在编码、计算机使用、推理、长任务能力、安全对齐上的水平全面拔高,成为新一代编程模型王者。新一轮围绕编程展开的百模大战即将展开,而Claude Sonnet 4.5即将成为大家争相对标的新对象。
北京时间今天凌晨,Anthropic正式发布了Claude Sonnet 4.5。
这一版本被Claude定义为全球最强的代码模型,同时在智能体构建、计算机使用、推理和数学能力上展现出显著突破。
代码无处不在,它驱动着应用程序、表格和各种工具。
现代工作的核心在于运用这些工具并解决复杂问题,而Sonnet 4.5让这一切更加高效和可靠。
全新功能与产品升级
伴随Sonnet 4.5,Anthropic对Claude全线产品进行了大规模更新:
Claude Code新增了备受期待的「检查点」(Checkpoints)功能,可随时保存进度并一键回滚到早先状态;同时更新了终端界面,并推出了原生VS Code插件。
ClaudeAPI增加了上下文编辑功能和记忆工具,让智能体能运行更久,处理更复杂的任务。
Claude apps现已支持在对话中直接执行代码、生成文件(包括表格、幻灯片和文档)。
Claude for Chrome扩展对此前等待名单中的Max用户开放。
开发者社区也迎来了新的核心资源:Claude AgentSDK。
这套工具包开放了驱动Claude Code的底层基础设施,为所有人打造智能体提供了基础能力。
前沿性能与基准成绩
Sonnet 4.5在多项权威测试中表现出色:
SWE-bench Verified:在真实软件编码能力测试中达到最新的最优水平,可在复杂的多步骤任务中保持超过30小时的专注执行。
OSWorld:在模拟真实计算机任务的基准中,以61.4%的成绩位居首位,而四个月前Sonnet 4还保持在42.2%。
视频演示了Claude for Chrome的模拟操作计算机任务能力
推理与数学:在一系列公共评测中大幅领先,特别是在金融、法律、医学和STEM等专业领域的知识与推理上,远超此前的Opus 4.1。
左右滑动查看
这些进展不仅体现在数据中,也得到了提前体验的专业用户们的高度评价:
Claude Code能自主编程30小时以上,帮助工程师在极短时间内完成原本要花费数月的架构工作。——Sean Ward, iGent AI CEO
replit内部代码编辑测试中,错误率从Sonnet 4的9%直接降至0%。——Michele Catasta, replit President
左右滑动查看
更强的对齐,更安全
Sonnet 4.5是迄今为止对齐性最好的Claude模型。
通过改进的能力和广泛的安全训练,模型在减少迎合、欺骗、权力追求和虚妄鼓励等行为方面取得了明显成效。
在智能体和计算机使用场景中,团队也特别加强了对提示注入攻击的防御。
这些改进已在系统卡(System Card)中以详细评估形式公开,其中首次引入了可解释性技术来验证安全性。
Sonnet 4.5按照AISafety Level 3(ASL-3)框架发布,包含一系列防护措施,例如针对化学、生物、放射和核相关内容的分类器过滤机制。
虽然这些过滤器可能偶尔误判正常内容,但与Sonnet 4相比,误报率已降低十倍,并将在未来继续优化。
Claude Agent SDK
在过去半年中,Claude团队不断迭代Claude Code,探索了智能体设计中的核心挑战,包括长时任务的内存管理、权限体系的平衡,以及子代理的协同方式。
如今,这些能力通过Claude AgentSDK向开发者全面开放。
Claude Agent SDK演示视频
SDK不仅适用于编码,还能支持更广泛的应用场景。
它为构建复杂任务的自主智能体提供了与Anthropic内部工具相同的基础设施。
研究预览:「Imagine with Claude」
作为额外的实验,Anthropic发布了一个临时研究预览——「Imagine with Claude」。
Imagine With Claude实时生成软件演示视频
在这一体验中,Claude会实时生成软件,没有预设功能或预写代码,用户可以直接看到Claude在交互过程中即时创造与适配的过程。
该功能向Max订阅用户开放5天,可在claude.ai/imagine上体验。
API新特性
Sonnet 4.5在API层面也带来了重要更新:
记忆工具(Beta):支持在上下文窗口外存储和调用信息,帮助跨会话维持知识和状态。
上下文编辑:通过自动清理旧的工具调用和结果来避免上下文溢出。
新的停止原因提示:增加了model_context_window_exceeded,更清晰地标识因上下文限制而中止生成。
工具参数改进:修复了字符串参数尾部换行被截断的问题,保证格式精确传递。
Token计数优化:系统会自动添加优化Token,但用户不会为这些系统注入的部分付费。
定价与使用渠道
价格保持与Sonnet 4一致:
输入:3美元/百万Tokens
输出:15美元/百万Tokens
Sonnet 4.5可通过以下渠道使用:
Claude API:claude-sonnet-4-5-20250929
Amazon Bedrock:anthropic.claude-sonnet-4-5-20250929-v1:0
Google Cloud Vertex AI:claude-sonnet-4-5@20250929
同时也在Claude.ai与Claude Code平台上线。
升级指南
当前使用Sonnet 4的开发者,只需将模型名称更新为claude-sonnet-4-5-20250929即可完成迁移。
所有现有API调用依然有效。建议同时启用新特性,例如记忆工具和上下文清理,以充分发挥模型性能。
需要注意的是,Sonnet 4.5不再允许同时指定temperature和top_p参数,用户应选择其一。
新一轮的AI编程大战即将来临
Claude Sonnet 4.5在编码、智能体能力、计算机使用和安全性方面实现了全面跃升。
它既是开发者工具箱中的新利器,也是一个能在金融、医学、科研等领域提供专业支持的强大平台。
Anthropic通过这一版本,继续推动AI在前沿能力和安全性上的平衡发展。
编程新王降临,新一轮围绕编程展开的百模大战即将展开,而Claude Sonnet 4.5即将成为大家争相对标的新对象。
参考资料:
https://www.anthropic.com/news/claude-sonnet-4-5
https://docs.claude.com/en/docs/about-claude/models/whats-new-sonnet-4-5
https://assets.anthropic.com/m/12f214efcc2f457a/original/Claude-Sonnet-4-5-System-Card.pdf
体育平台链接下载
西甲买球站
球探体育即时
三公扑克
有没有反水高的平台棋牌
英亚体育官方网站
德州口袋扑克停运了吗
金沙手机电子游戏app
AG真人官网是多少
球探网足球即时比分app
8590网站多少
注册就送2021
9州体育app
新云顶娱乐官网
澳门凯发
manbetx手机版网页版
宝博体育官网入口
美高美网址多少
怎么找信用盘
bet登录入口
bob的网址是多少
火狐客户端下载
新宝app下载
千亿国际手机官网下载
365速发国际app
线上赌钱注册下载
欧洲杯2019半决赛
千赢官网app下载苹果
开云
千贏国际官网
凯发娱乐平台网页登录
乐鱼体育最新
金宝搏app
k8真人
内部精选A
黄金城线路一
永乐娱乐
AG真人集团官网
AG体育sport
九洲十年信誉娱乐平台
升博电子网投
彩神彩票官网登录平台
体育投注网站app
球探比分网-足球即时比
亚盈体育app官网下载
英皇娱乐入口登录
bet官网注册
沙巴体育足球规则
beplay体育app苹果
719棋牌
雷速体育即时比分
365bet体育官方app
万博manbext手机app
银河国际app下载注册
十bet体育
杏鑫app
抢庄牛牛玩法规则
威尼斯人手机版官网下载
球探比分直播手机
m6米乐手机版登陆
bob综合体育入口
wepoker安卓手机下载
万象棋牌
ca88亚登录
鸿博体育官方
365bet手机app
新葡萄官网下载安装
168官网买球
M6平台首页
澳门龙虎真人下载正规平台
ManBetX万博电竞
云顶娱乐官网登录手机版
开元棋盘游戏中心官网
在线下注网址
im体育手机APP
澳门百家规则
宝马会最新地址
365登录入口官方网站
真人现金斗牛平台
北京pk10开奖直播 上快赢
大奖官方网站888
网友评论 查看所有评论>>