(10分钟全面了解)又长又粗的黄色网电脑版v14.18.36.76.67.5-2265安卓网_新万博体育

新万博体育

图片
搜索
猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

Claude Opus 4.5突袭上线,直接降价2_3!首批用户实测:效率直接翻2倍!这才是程序员想要的 AI

2025-11-19 03:22:29
来源:

猫眼电影

作者:

周春声

手机查看

  猫眼电影记者 张玉红 报道Q8X2R7L1T4J5M9B6W3

作者 | 辰辰

出品 | 网易科技

疯了,全都杀疯了!这个11月注定要载入AI史册。

Gemini 3的余温还没散,GPT-5.1的热度正当时,就在所有人都以为年度大戏即将落幕时, 一向“人狠话不多”的Anthropic搞了一次从天而降的“偷袭”。Claude Opus 4.5横空出世,直接跳过了常规的宣发流程,用最硬核的产品硬刚对手。

官方直接摊牌:论写代码、论搞智能体,我才是最强的。这究竟是盲目自信,还是底气十足?

下面带你硬核拆解。

1. 核心亮点速览:性能飙升与成本暴跌

Claude Opus 4.5不仅仅是能力的提升,更是一次对效率和普惠性的重新定义。

——性能登顶

Anthropic内部有一项针对“顶尖工程师”候选人的入职测试,以高难度和时间紧迫著称,限时只有2小时。

结果显示:Claude Opus 4.5的得分高于该公司历史上任何一位人类候选人。

注意,这可不止是写出一段代码,而是综合考量技术能力和高压下的判断力。虽然通过测试并不意味着AI拥有了人类的沟通协作能力,但表明在纯技术执行层面,Claude Opus 4.5已经捅破了人类工程师的天花板。

再看行业通用的SWE-bench Verified(真实软件工程基准测试)数据,Opus 4.5以80.9% 的准确率傲视群雄:

· Claude Opus 4.5: 80.9%

· GPT-5.1-Codex-Max: 77.9%

· Claude Sonnet 4.5: 77.2%

· Gemini 3 Pro: 76.2%

在AI编程领域,3个百分点的提升往往意味着从“经常还要我自己改bug”到“这代码写得比我溜”的质变。

Opus 4.5的前端开发、视觉处理能力显著提升,更擅长操作电脑,真实场景的软件工程测试中创新高。

此外,Opus 4.5编写的代码质量更高,SWE-bench Multilingual测试的8种编程语言中,Opus 4.5有7种都处于领先地位。

——价格革命:成本直降三分之二

上一代Opus(Opus 4.1)虽然聪明,但每百万输入Token 15美元/每百万输出Token 75美元的价格简直是“贵到离谱”。

这次Anthropic终于听劝了。Opus 4.5的定价大幅下调至每百万输入Token 5美元/每百万输出Token 25美元。

相比上一代Opus,价格直接砍掉三分之二。

虽然比GPT-5.1(每百万输入Token 1.25美元/每百万输出Token 10美元)还是要贵一些,但考虑到Opus 4.5是专为解决复杂难题打造的“重型武器”,这个价格已经进入了企业和开发者的“甜蜜区”。

这一策略也给竞争对手带来了性能和定价的双重压力。

——效率飞跃:Token用量大幅减少

通过引入可设置高、中、低的“努力程度”(effort)效率参数,Opus 4.5能让开发者在效率和能力之间作出取舍。

在中等努力(Medium Effort)水平下,Opus 4.5在SWE-bench Verified上达到了Sonnet 4.5的最佳分数,但输出Token使用量减少76%。

在最高努力(High Effort)水平下,Opus 4.5的性能比Sonnet 4.5高出4.3个百分点,同时Token使用量仍减少48%。

2. 产品力全面升级:面向日常办公的超强智能体

Anthropic同时发布针对Agent和日常生产力工具的重大更新,让Opus 4.5更具实用价值。

——突破上下文的“无限聊天”

以前和AI聊久了就得重开对话框。现在Anthropic解决了长对话任务的痛点,通过上下文压缩(Context Compaction)和内存管理实现了面向付费用户的“无限聊天”功能。模型会智能地压缩历史对话记忆,有效解决了传统上下文窗口的限制,使Agent任务能够持续运行而不会“失忆”。这对于长周期的项目开发简直是救命稻草。

——Agentic能力与创造性思维

Opus 4.5在智能体任务中展现出卓越的情境管理和高级工具使用能力,甚至能高效管理多智能体系统。

此外在解决实际问题时,模型表现出更像人的“变通能力”。在一项模拟航空客服的测试中,规则是不允许修改经济舱机票,之前的模型因此会直接拒绝客户。但Opus 4.5想到了一个“骚操作”:先帮客户升舱,然后再修改航班。虽然这在测试中因为没守规矩而被判了“失败”,但这种创造性的解决问题能力,恰恰是人类最看重的。

——全新集成与开发工具

· 办公集成:?Claude for Excel现已向Max、Team、Enterprise用户全面开放,支持数据透视表、图表等复杂操作。Chrome浏览器插件也已经向所有Max用户开放。

· Claude Code增强:?引入更精细的 “计划模式”(Plan Mode),Agent会在执行前生成一个用户可编辑的plan.md文件。Anthropic还面向开发者发布了“程序化工具调用”功能,允许Claude编写和执行直接调用函数的代码。同时,Claude Code现已在桌面应用上推出,支持并行运行多个本地和远程会话。

3. 用户测评与各方评价:Opus 4.5究竟“神”在哪?

新模型的发布激起了行业内外的强烈反响。除了官方的基准数据,来自开发者和企业的真实反馈更具说服力。

Anthropic的早期测试者和客户反馈高度一致:Opus 4.5展现出显著增强的判断力和处理复杂模糊任务的能力。

Anthropic开发者关系负责人亚历克斯·艾尔伯特(Alex Albert)提到,测试人员一致认为Opus 4.5在处理复杂的多系统错误时能直接找出解决方案,并能在无需人工干预的情况下权衡利弊,拥有了“一种直觉和判断力”,这标志“质的飞跃”。

企业客户初步验证了效率方面的说法。

· 日本电子商务和互联网公司乐天测试了Claude Opus 4.5在办公任务自动化方面的表现。基于Opus 4.5的智能体仅用4次迭代就达到最佳性能,而其他模型在10次迭代后仍无法匹敌。乐天商业AI总经理加藤裕介(Yusuke Kaji)表示,这展现了其具备“自我改进”智能体的潜力。

· Fundamental Research Labs的报告则称其内部评估准确性提高了20%,效率提升了15%,以前遥不可及的复杂任务现在变得可以实现。

· GitHub首席产品官马里奥·罗德里格斯(Mario Rodriguez)表示,早期测试显示Opus 4.5超越了内部编码基准,并将Token使用量削减了一半,特别适用于代码迁移和重构等任务。

· 云编码平台Replit总裁米歇尔·卡塔斯塔(Michele Catasta)则盛赞Opus 4.5在内部基准测试中优于Sonnet 4.5和竞品,并强调这种效率提升在规模化应用时会产生复利效应。

从社媒用户反应来看,评价多为正面,大家普遍认为Opus 4.5性能优异,有助于提升生产力。

Andon Labs在社交平台X发布了自己用Vending-Bench 2测试Opus 4.5的结果,显示紧随Gemini 3 Pro之后,位列第二,表现出色。

HyperWriteAI CEO马特·舒默(Matt Shumer)则用Claude Opus 4.5测试生成类似Colab的用户界面。他认为,绝对比之前用GPT-5.1和Gemini 3做的类似测试要好得多。

用户@deredleritt3r则提到,Anthropic公司调查了18名内部员工使用Opus 4.5 + Claude Code后的感受。其中半数员工表示效率翻倍,其中甚至有人认为自己的生产力提升高达220%。

4. 资深开发者深度体验:前沿模型趋同性不可避免

知名开发者和技术评论家西蒙·威利森(Simon Willison)提前拿到了内测资格,他在两天内用Claude Opus 4.5对开源项目sqlite-utils进行了大规模重构。

战绩如下:

· 20次代码提交;

· 修改了39个文件;

· 增加了2022行代码,删除了1,173行代码。

威利森还测试了用Opus 4.5编写代码(SVG)来绘制鹈鹕骑自行车的经典案例。

结果显示,提示词越详细。Opus 4.5的表现就更好。

威利森的评价很中肯:“它显然是一个卓越的新模型。”然而他坦言,在编程任务切换回Sonnet 4.5后,工作速度并未感觉明显放缓。

换言之,对于日常任务,很难明显感知到Opus 4.5和Sonnet 4.5的巨大差异。这说明现在的模型在处理“简单任务”时已经出现了边际效应递减。

威利森指出,对于当下的一系列“前沿模型”(Frontier LLMs),要找到能明确区分它们与上一代模型的具体任务示例变得越来越困难。他呼吁AI实验室提供“一个在Sonnet 4.5上失败但在Opus 4.5上成功的具体提示示例”,这比基准测试上个位数的提升更具吸引力。

威利森还提到,尽管Anthropic声称Opus 4.5在对抗提示词注入(Prompt Injection)攻击方面比业界其他任何前沿模型都更具鲁棒性,但安全问题依然存在。数据显示,单次尝试提示注入的成功率约为1/20;如果攻击者尝试十种不同的攻击,成功率则上升到1/3。这表明,在设计应用程序时,仍需假定攻击者能够找到绕过模型防御的方法。

用户@peterwildeford也在X上提到,“基准测试指数已不再能可靠排除风险。最终判断很大程度上依赖于专家意见。”虽然他认为Claude 4.5 Opus足够安全,“但这种从基准指数向主观感受的转变令人担忧。”

5. 竞争格局:AI大战持续升温

Opus 4.5的发布,发生在OpenAI和Google模型更新的“混战”之后,充分体现了AI市场的白热化竞争。

Anthropic自身的高速增长为这场竞争奠定了基础。在2025年第一季度,Anthropic的年化收入达到20亿美元,相比上一季度的10亿美元翻了一倍多。同时,年消费超过10万美元的客户数量也实现了同比八倍的增长。

然而,Opus 4.5在Haiku 4.5(10月)和Sonnet 4.5(9月)发布后仅数周内即上线,这种快速迭代清晰反映了整个行业的动态:竞争压力迫使厂商不断加速。

Anthropic开发者关系主管艾尔伯特承认,他们之所以能如此快速地迭代,部分原因在于使用Claude自身来加速产品开发和模型研究。

另一方面,Opus 4.5的定价大幅下调虽然会压缩利润空间,但却能扩大潜在市场。艾尔伯特预测,降价将促使大量初创企业更广泛地将Opus 4.5集成到其产品中并作为核心功能展示。

对于开发者和企业而言,这种激烈的竞争带来了最直接的好处:AI能力的迅速提升和价格的不断下降。更强的性能、更低的成本和“无限聊天”等实用功能,意味着AI智能体将在日常工作流中扮演更核心的角色。Opus 4.5的到来,或许正是我们工作方式彻底变革的开始。

6. 总结:开发者的新玩具,行业的新标杆

Claude Opus 4.5的发布,标志着AI模型竞争进入了“拼落地、拼逻辑、拼成本”的下半场。

它不再只是单纯地堆参数,而是通过“Effort”参数控制思考深度,通过“无限对话”解决实际工作流痛点。对于需要处理复杂逻辑、长代码重构、深度研究的用户来说,这无疑是目前的地表最强工具。

如果你是普通用户,Sonnet 4.5依然是性价比之王;但如果你是需要处理复杂架构的程序员,或者需要AI进行深度调研的研究员,每个月花点钱升级到Opus 4.5,可能是今年最划算的一笔投资。

??时事1:女女同性女同区二区

??11月19日,国台办:民进党当局妄想给正义行动“划线设禁”是不自量力,

京东金融欠多少钱能起诉?欠钱被起诉了会坐牢吗

,人人看。人人摸。人人操。

??11月19日,西藏日报联合5家党报特别策划——代表委员话援藏:金色哈达跨越山海·30年印记,

  坚持好的工作作风体现在全心全意为人民服务上。办公室作为各级党委联系群众的桥梁和纽带,基层的情况、群众的意见呼声都要通过办公室反映到党委;党委的决定又要通过办公室传达到基层和群众中去。因此,不断改进办公室的工作作风,提高办公室为群众和基层服务的水平就显得尤为重要。办公室是党委的重要部门,更是党委的“窗口”,办公室干部的一言一行、一举一动,都直接影响到党委机关在群众和基层的形象。在日常工作中,对前来办文办事、联系工作的人员和来访群众,要热情接待,不摆架子,不盛气凌人,坚决克服“门难进、脸难看、事难办”的现象。要从热心办、马上办、办得好上做文章,从摸实情、办实事、创实绩上花力气,从勤动脑、多思考、出好谋上下功夫,雷厉风行,提高办事效率,树立良好的亲民形象。

,国产aV无码片毛片一级国语对白,160mk2成色带图片,一区欧美二区国产A片一级。

??时事2:99视频在线播放

??11月19日,学生减少,缩减班级数不如推进小班化教学,

  在这个金秋的八月,在这个阳光灿烂的日子里,我们,这群青春洋溢的青年,从四面八方走到了一起,走进了这个集体,从此,我们生活的轨迹有了一段同行的日子;从此,我们的心有了一份共同的牵挂;从此,我们便是不需血脉而相连的兄弟姐妹;从此,我们成了一家人。青春之路,一个多么美好的句子,一段多么值得记录的经历。在很多年以后的未来,它将是你人生中一笔最为宝贵的财富。让我们用心创造,用汗水和拼搏创造,创造我们心中的集体,为未来留一份回忆,留一篇青春的日记。走进一个新的集体,你便又拥有了一个温暖的家。

,徐少强给老婆扎还魂针,性色一级精品顶级毛片,免费精品一级黄色视频。

??11月19日,乙醇生产新技术背后有何大文章,

  “说兵器呢,你们扯哪去了?”

,91精品福利高清产清,narutojizzxxxx,91在线一区精品无码。

??时事3:我要看超级特级黄色片色

??11月19日,“假把式”骗不了人 弄虚作假后果自负,

  “雄关漫道真如铁,而今迈步从头越”。花开的季节真美,青春的年华真好。青春是飘扬的旗,是起航的船,是绽放的花。虽然青春的花只开一季,尽管青春的也花会凋谢,旅途中也会雨雪纷飞,但你们肯定会奋斗而永不停歇,拼搏而永不言退。同学们,新学期的号角已经吹响,新的征程开始启程。今后的一千多个日夜里,永中就是你们的家。在这里,希望与困难同在,机遇与挑战并存,激战与友谊共有。但可以肯定的是,你们每一天都会有进步,永中也会因你们的进步而不断发展。可以坚信的是,三年的生活,会有杀场鏖战的激烈,也会有诗意挥洒的浪漫,会有失意时的困惑,更会有战胜自我的快乐;三年的耕耘,你们的聪明才智,一定会得到最充分的展示;三年的奋斗,你们一定会攀到更高的山峰,领略到最美的风景;三年的磨砺,你们将逐渐成才,青春的活力将会焕发出更加蓬勃的生机。

,爱爱一级勉费试看视频,免费观看的黄色高清视频,欧美黄片免费在线视频。

??11月19日,深江铁路深圳机场东站项目进入全面施工建设阶段,

  市、县(市)区档案部门始终把加强档案干部队伍思想建设作为一项重要工作来抓,认真组织档案干部学习党的xx大精神和省、市档案工作会议精神,把思想统一到党的路线、方针、政策上来,把力量凝聚到实现市委、市政府确定的各项目标任务上来。市、县(市)区档案部门、市城建档案馆开展以岗位培训和继续教育为基础,以新知识、新技能的为重点,以学历教育为补充等多种形式学习培训活动,积极组织未取得档案上岗资格证的专兼职档案人员参加省档案局组织的上岗资格培训考试,不断提高了档案工作人员业务水平与专业技能。认真组织干部职工参加了《__市20__年全民普法》和专业技术人员继续教育等考试。完成了全市档案专业技术任职资格高级的审核、推荐和中、初级评审工作,全市共有6人、9人、14人专业技术人员分别评审为高、中、初级专业技术职务任职资格。积极开展抗震救灾捐款活动,档案系统全体干部职工积极捐款捐物和交纳特殊党费,为灾区人民献上了一份爱心。

,免费直播行情网站,欧美日本在线性色,白鹿裸乳被爆 白浆。

??时事4:一边亲一边摸一边桶视频

??11月19日,实拍广西苍梧乡村夜市:夜经济释放新活力,

  1、增强职工学习的自觉性,正确处理工作和学习的关系,安全与生产的关系,既要踏实苦干,又要扎实苦学,科学地安排时间,珍惜时间,把功夫下在学习上,不断充实和完善自己。使职工能做到学有计划、学有笔记、学有记录、学有质量,防止流于形式。

,人人操人人干A片免费,米塔被 到爽 流漫画在线看,yz558视频在这里只只有精品久久。

??11月19日,美国会众议员奎利亚尔因受贿、洗钱等被起诉,

  “清风别紧张,重新接续断筋一定会成功的,有这些宝药在,保证可让你筋骨再生。”小不点安慰。

,色人人操色人人干,丝瓜污官网入口在线观看,嫩小摇是卖的吗。

责编:张彦雄

审核:尼基亚

责编:申华永

相关推荐 换一换