猫眼电影
猫眼电影记者 万骏 报道P6F3X2M7T9QJ8L1B4WZR
就在刚刚,Anthropic 宣布推出 Claude Sonnet 4.5。官方将其定位为“全球最强的代码模型”“构建复杂智能体的最强模型”以及“最会用电脑的模型”,并称其在推理与数学上也有显著提升。新模型同步带来一组面向开发者与企业使用的能力升级:包括 Claude Code 的 VS Code 原生扩展、终端 2.0 与一键回滚的 Checkpoints,面向 API 的上下文编辑(Context Editing)与记忆工具(Memory Tool),以及用于自建智能体的 Claude Agent SDK。
1
从 7 小时到 30 小时:Claude 的长跑能力
最受瞩目的变化是持久执行能力。Anthropic 在客户测试中观察到,Sonnet 4.5 在复杂多步骤任务中可以连续专注运行 超过 30 小时,远超前代约 7 小时的表现。这并不意味着所有任务都能达到相同时长,但足以说明模型在“耐力”上的跨越。
在权威基准测试中:
SWE-bench Verified:在“标准算力”下准确率为 77.2%,更高测试条件下最高可达 82.0%。
OSWorld(电脑使用能力):取得 61.4% 的成绩,领先所有已知模型;而四个月前 Sonnet 4 的分数为 42.2%。
数学与推理:在 AIME、MMMLU 等多类评测上均有明显提升,系统卡披露了具体运行设置与多语言评测细节。
这些数据共同指向一个结论:Sonnet 4.5 在解决现实任务、操作复杂系统方面比以往更稳健。
1
不止能写代码,Claude 正在学会托管整个工程
这次更新不仅是模型能力的提升,更是开发工具链的一次升级。
Claude Code:新增 VS Code 扩展(Beta),提供可视化改动与内联 diff;终端 2.0 支持历史检索,新增 Checkpoints 功能,允许在大改动前保存进度、随时回滚。Sonnet 4.5 也成为 Claude Code 的默认模型。
Claude Agent SDK:开放内部的“智能体底座”,包括上下文管理、权限/交互设计、子智能体协作等机制,方便企业定制自己的专用智能体。
上下文管理与记忆:
1. Context Editing 能在接近 token 上限时自动清理陈旧信息,保留关键上下文。
2. Memory Tool 允许在对话外存储和复用知识。官方数据显示,两者结合可让复杂检索任务成功率提升 最高 39%,并在长时 Web 搜索中将 token 消耗减少 84%。
应用层体验:Claude 网页和桌面端新增代码执行与文件生成功能,Chrome 扩展也面向 Max 用户开放。
换句话说,Claude 4.5 不只是“更聪明的助手”,更像一个能全天候值守的开发伙伴。
1
安全边界更严,价格却没涨
Sonnet 4.5 以 ASL-3 安全级别发布。Anthropic 强调,它在防止逢迎、欺骗、提示注入等方面表现更稳健,并配有针对 CBRN(化生放核)风险的内容分类器,以降低滥用可能。
定价维持不变:
API:输入 $3 / 百万 token,输出 $15 / 百万 token。
模型名:claude-sonnet-4-5-20250929(别名 claude-sonnet-4-5)。
渠道:已上线 AWS Bedrock 与 Google Cloud Vertex AI。
此外,Anthropic 还推出了为期五天的实验项目 “Imagine with Claude”,面向 Max 用户展示 Sonnet 4.5 如何从零生成应用。
1
夜班战士与干将智囊:开发者怎么用 Claude 4.5
在早期客户的实验中,Sonnet 4.5 被用于从零构建一个聊天应用:模型不仅能拉起前端与后端,还能自行调试数据库接口,连续工作超过一天一夜。这种“长跑式执行”让开发者直呼“就像有了一个夜班战士”。
在实际使用中,开发者们发现 Sonnet 4.5 与更强大的 Opus 形成了互补:前者更适合日常落地和持续推进,后者则用于解决最复杂的问题。有人戏称,“Claude 已经变成双保险:Opus 担当‘智囊’,Sonnet 则是‘干将’。”
当然,现实也提醒我们保持冷静。一些研究指出,即便是最强的生成模型,自动生成的代码仍可能隐藏缺陷或带来安全隐患。因此,Claude 再强,也依然需要人类开发者的监督和测试。
1
从助手到工友:耐久执行的 Claude 时代
Claude Sonnet 4.5 的关键词是 “耐久执行”。它不仅能做事,还能把事坚持做下去,并配套一整套工具链,把开发流程托管得更稳。这意味着 AI 正在从“对话助手”逐渐走向“可靠工友”,从短平快的输出迈向长期、系统化的执行。
而这一切,也让人联想到不久前 Anthropic 联合创始人曾透露的那句话:“在公司内部,工程师们已经不再写代码了。” 当时不少人半信半疑,觉得这更像是一种宣传话术。可如今,当我们看到一个能连续工作 30 小时、能自己拉起网站、写前后端、调试接口的 Claude 4.5 真正发布出来时,那句“工程师已不写代码”的未来图景,似乎真的有了几分可信。
信息来源:
Anthropic 官方新闻稿:Introducing Claude Sonnet 4.5
Reuters(路透社): https://www.reuters.com/business/retail-consumer/anthropic-launches-claude-45-touts-better-abilities-targets-business-customers-2025-09-29/
点个“爱心”,再走 吧
??时事1:a级亚洲
??09月28日,浙江杭州:七十年历史的新华书店升级回归,
各位领导、各位同仁、企业全体人员及其家人们:
,欧美你懂。??09月28日,辽宁省技能精英冲刺全国乡村振兴职业技能大赛,
一座石门开启后,符文飞舞,入目皆是灿灿的光,石桌上有玉壶与玉杯,流动曦光,数十位强者一起伸手向前抓去。
,婷婷这里只有精品,免费中文字幕视频网站,国产高清一区免费视频。??时事2:欧美在线一区综合日韩
??09月28日,斯洛伐克国家交响乐团奏响南昌,
三是落实不力。 抓落实,是衡量干部政治素质的一个重要标志,是一个地方干部作风的综合表现。现在我镇干部中普遍存在抓而不实、抓而不紧、抓抓停停的现象。有的同志高高在上不愿抓落实,无计无谋不会抓落实,怕苦怕累不想抓落实。落实不力已经成为我镇干部作风问题的顽症。干部素质不高、能力不强,特别是在困难环境中解决问题的能力不强,在困难面前没有战胜困难的勇气,没有克服困难的能力,没有真抓实干的精神,束手无策,无所作为。很多地方存在着人浮于事、无事可做的不良现象。就目前来看,同志们抓工作落实力度各不相同,有的村、单位和个人积极按照镇上的部署安排,结合自身实际,主动工作,落实得很好;可就有那么些村、单位和个人,工作敷衍塞责,人浮于事,不仅不主动,不积极,甚至于连镇党委政府安排的工作,他们也当作耳边风,放在一边根本就不当一回事。我们催一催,他们才开始动一动。这样的单位、这样的村、这样的干部工作干得好才怪昵。说句实在话,现在我们整天讲的“一条龙”服务,“一站式”服务,首问负责制,便民服务等等,哪一句不是一句空话,不是一纸空文。我们便民服务大厅,形同虚设,十几万元成了一个摆设。抽调六七个人在里面办公,到头来,我们有几个人整天在里面办过公,为民办了几件实事。当然这既有客观原因:一些事件不能直接在大厅里面办结,必须到县直相关部门办理,但我想最主要的还在于我们一些同志为民办事的服务意识不强,大局意识不浓。便民服务大厅才形成了今天这种无人问津的地步。
,c开操网,自拍视频网址,奸丝袜美女国产视频91。??09月28日,孙杨复出首秀夺小组第一 晋级400米自由泳决赛,
“多谢嫂子,有几位族老看着就行了,麻烦你们多不好。”夫妻两人道谢。
,操逼视频强奸免费福利院色多多,97免费在线视频手机版,免费看毛片地址。??时事3:亚洲日韩第二页
??09月28日,千年潞绸:岁月长河“织”繁华,
“没毛的大鹰过来,朝我这里冲!”石林虎大叫,顶在最前方,仰头看着那头俯冲下来的凶禽,与此同时他从怀中掏出一块兽骨,应是凶兽的臂骨。
,超踫免费,日韩一区,国产二区,欧美三区,国产又爽又黄又湿免费99。??09月28日,财经观察:“硬防晒”渐成标配 撬动夏日消费“新蓝海”,
他与祭灵大战了数百回合,全靠强大的意志以及一口气撑到现在,终于可以放松了。血早就止住,体内噼啪作响,再造血肉,重修体魄。
,美女视频永久黄网站免费观看国产,四五十路熟妇高熟,在线看片免费aa。??时事4:歐美精品免費播放
??09月28日,2024永川国际女足锦标赛:中国队3比0胜乌兹别克斯坦队,
最后,祝全体师生在新的一年里,百尺竿头更进一步!
,91精品福利大全在线观看,99er12精品视频,国产精品强奸乱伦贵阳。??09月28日,沙县小吃为何能大吃四方?,
小不点大窘,这也太丢人了,顶着这个名字,以后怎么见人啊?
,国产日产欧美性爱,可以看的黄色网站,色妞影院AV。责编:韦杵
审核:寇轩铭
责编:宋周尧