v4.796.6744.316249 安卓免費版
v2.456.2022.106072 安卓免費版
v9.840.1325.990024 PC版
v6.426 安卓最新版
v3.461.9185 安卓漢化版
v7.47 安卓免費版
v6.401 IOS版
v9.498.2583 最新版
v6.338.8746.431841 安卓免費版
v6.123 PC版
v2.170.8942.433118 PC版
v2.587.6294.294868 PC版
v5.324.7842.916468 安卓版
v2.971.7292.661928 安卓漢化版
v1.248 安卓最新版
v2.803 安卓最新版
v6.212.5342.903491 安卓免費版
v7.450.1769.949567 最新版
v7.705 安卓免費版
v5.418.2713.287562 安卓免費版
v7.723 安卓最新版
v6.806.368.316573 最新版
v1.32.6616.10109 安卓版
v1.439 安卓漢化版
v9.497 安卓免費版
v4.835.941.675929 IOS版
v9.565.7563 最新版
v1.669.3936.489282 PC版
v9.844 安卓漢化版
v5.74.8862 安卓漢化版
v9.998.4223.668895 最新版
v4.742.5011.107913 安卓版
v9.524.2526 IOS版
v1.353.7382.832175 PC版
v2.442 安卓最新版
v9.289.3474.915067 PC版
v5.819.2049.391247 IOS版
v6.127.2970.11772 最新版
v4.19.9713 安卓最新版
v5.692.4222.571463 IOS版
v1.548.8866 PC版
v3.662.7177.511196 安卓版
v4.66 安卓版
v5.738 IOS版
v6.616.7284 安卓最新版
v4.558.3674.871538 安卓版
v7.649 安卓版
v4.150.3377 IOS版
v3.349.8155.567079 安卓免費版
v2.904.6690.808270 安卓免費版
v2.701.3339.682071 安卓版
v3.490 最新版
v1.355.3430 安卓最新版
v7.485.2733.631137 安卓最新版
v8.995.2208.395546 安卓版
v6.948.2574.725191 安卓免費版
v2.624.5851 最新版
v2.403 安卓最新版
v2.137.7331.27028 IOS版
v6.526.8636.169624 PC版
v7.310.5366.223573 安卓免費版
v7.720.408 安卓漢化版
v4.450.9616.842494 安卓版
v8.674.7152 安卓最新版
v9.589.3449 安卓漢化版
v2.440.2541.143535 安卓最新版
v5.965 PC版
v5.755.9587.607583 最新版
v2.641.5633.289551 安卓免費版
v4.947 安卓免費版
v1.209 PC版
v6.391 安卓免費版
v6.251.3121.679518 安卓版
v7.341.3397.406874 最新版
v3.972.2988.686529 安卓最新版
v7.70.6913.821272 安卓漢化版
v9.177.1468 安卓最新版
v7.189 IOS版
v2.878 安卓最新版
v8.801.5117 最新版
开元ky大富翁棋牌
新智元报道
编辑:艾伦
【新智元导读】今天凌晨,Claude Sonnet 4.5发布了!新模型在编码、计算机使用、推理、长任务能力、安全对齐上的水平全面拔高,成为新一代编程模型王者。新一轮围绕编程展开的百模大战即将展开,而Claude Sonnet 4.5即将成为大家争相对标的新对象。
北京时间今天凌晨,Anthropic正式发布了Claude Sonnet 4.5。
这一版本被Claude定义为全球最强的代码模型,同时在智能体构建、计算机使用、推理和数学能力上展现出显著突破。
代码无处不在,它驱动着应用程序、表格和各种工具。
现代工作的核心在于运用这些工具并解决复杂问题,而Sonnet 4.5让这一切更加高效和可靠。
全新功能与产品升级
伴随Sonnet 4.5,Anthropic对Claude全线产品进行了大规模更新:
Claude Code新增了备受期待的「检查点」(Checkpoints)功能,可随时保存进度并一键回滚到早先状态;同时更新了终端界面,并推出了原生VS Code插件。
ClaudeAPI增加了上下文编辑功能和记忆工具,让智能体能运行更久,处理更复杂的任务。
Claude apps现已支持在对话中直接执行代码、生成文件(包括表格、幻灯片和文档)。
Claude for Chrome扩展对此前等待名单中的Max用户开放。
开发者社区也迎来了新的核心资源:Claude AgentSDK。
这套工具包开放了驱动Claude Code的底层基础设施,为所有人打造智能体提供了基础能力。
前沿性能与基准成绩
Sonnet 4.5在多项权威测试中表现出色:
SWE-bench Verified:在真实软件编码能力测试中达到最新的最优水平,可在复杂的多步骤任务中保持超过30小时的专注执行。
OSWorld:在模拟真实计算机任务的基准中,以61.4%的成绩位居首位,而四个月前Sonnet 4还保持在42.2%。
视频演示了Claude for Chrome的模拟操作计算机任务能力
推理与数学:在一系列公共评测中大幅领先,特别是在金融、法律、医学和STEM等专业领域的知识与推理上,远超此前的Opus 4.1。
左右滑动查看
这些进展不仅体现在数据中,也得到了提前体验的专业用户们的高度评价:
Claude Code能自主编程30小时以上,帮助工程师在极短时间内完成原本要花费数月的架构工作。——Sean Ward, iGent AI CEO
replit内部代码编辑测试中,错误率从Sonnet 4的9%直接降至0%。——Michele Catasta, replit President
左右滑动查看
更强的对齐,更安全
Sonnet 4.5是迄今为止对齐性最好的Claude模型。
通过改进的能力和广泛的安全训练,模型在减少迎合、欺骗、权力追求和虚妄鼓励等行为方面取得了明显成效。
在智能体和计算机使用场景中,团队也特别加强了对提示注入攻击的防御。
这些改进已在系统卡(System Card)中以详细评估形式公开,其中首次引入了可解释性技术来验证安全性。
Sonnet 4.5按照AISafety Level 3(ASL-3)框架发布,包含一系列防护措施,例如针对化学、生物、放射和核相关内容的分类器过滤机制。
虽然这些过滤器可能偶尔误判正常内容,但与Sonnet 4相比,误报率已降低十倍,并将在未来继续优化。
Claude Agent SDK
在过去半年中,Claude团队不断迭代Claude Code,探索了智能体设计中的核心挑战,包括长时任务的内存管理、权限体系的平衡,以及子代理的协同方式。
如今,这些能力通过Claude AgentSDK向开发者全面开放。
Claude Agent SDK演示视频
SDK不仅适用于编码,还能支持更广泛的应用场景。
它为构建复杂任务的自主智能体提供了与Anthropic内部工具相同的基础设施。
研究预览:「Imagine with Claude」
作为额外的实验,Anthropic发布了一个临时研究预览——「Imagine with Claude」。
Imagine With Claude实时生成软件演示视频
在这一体验中,Claude会实时生成软件,没有预设功能或预写代码,用户可以直接看到Claude在交互过程中即时创造与适配的过程。
该功能向Max订阅用户开放5天,可在claude.ai/imagine上体验。
API新特性
Sonnet 4.5在API层面也带来了重要更新:
记忆工具(Beta):支持在上下文窗口外存储和调用信息,帮助跨会话维持知识和状态。
上下文编辑:通过自动清理旧的工具调用和结果来避免上下文溢出。
新的停止原因提示:增加了model_context_window_exceeded,更清晰地标识因上下文限制而中止生成。
工具参数改进:修复了字符串参数尾部换行被截断的问题,保证格式精确传递。
Token计数优化:系统会自动添加优化Token,但用户不会为这些系统注入的部分付费。
定价与使用渠道
价格保持与Sonnet 4一致:
输入:3美元/百万Tokens
输出:15美元/百万Tokens
Sonnet 4.5可通过以下渠道使用:
Claude API:claude-sonnet-4-5-20250929
Amazon Bedrock:anthropic.claude-sonnet-4-5-20250929-v1:0
Google Cloud Vertex AI:claude-sonnet-4-5@20250929
同时也在Claude.ai与Claude Code平台上线。
升级指南
当前使用Sonnet 4的开发者,只需将模型名称更新为claude-sonnet-4-5-20250929即可完成迁移。
所有现有API调用依然有效。建议同时启用新特性,例如记忆工具和上下文清理,以充分发挥模型性能。
需要注意的是,Sonnet 4.5不再允许同时指定temperature和top_p参数,用户应选择其一。
新一轮的AI编程大战即将来临
Claude Sonnet 4.5在编码、智能体能力、计算机使用和安全性方面实现了全面跃升。
它既是开发者工具箱中的新利器,也是一个能在金融、医学、科研等领域提供专业支持的强大平台。
Anthropic通过这一版本,继续推动AI在前沿能力和安全性上的平衡发展。
编程新王降临,新一轮围绕编程展开的百模大战即将展开,而Claude Sonnet 4.5即将成为大家争相对标的新对象。
参考资料:
https://www.anthropic.com/news/claude-sonnet-4-5
https://docs.claude.com/en/docs/about-claude/models/whats-new-sonnet-4-5
https://assets.anthropic.com/m/12f214efcc2f457a/original/Claude-Sonnet-4-5-System-Card.pdf
相关版本
多平台下载
查看所有0条评论>网友评论