就在刚刚,Anthropic 发布了 Claude Haiku 4.5。
先简单科普一下,Claude 家族有三个不同参数量级的模型:Claude Opus(大杯)、Sonnet(中杯)和 Haiku(小杯)。
这次更新最大的看点是,小杯 Claude Haiku 4.5 在模型性能保持高水准的同时,速度更快、价格更便宜了。
五个月前,Claude Sonnet 4 还是最先进的模型之一。现在新出的 Haiku 4.5 在编码性能上几乎和它打平手,但价格只要三分之一,速度还翻了两倍多。
▲Chart comparing frontier models on SWE-bench Verified which measures performance on real-world coding tasks
具体来说,在用于衡量 AI 编码能力的测试集 SWE-bench Verified 上,Haiku 4.5 取得了 73% 的成绩,什么概念?直接跟 Claude Sonnet 4 以及 OpenAI 最新的 GPT-5 站在同一水平线上。
在某些任务比如操控电脑方面,Haiku 4.5 甚至反杀了老大哥 Sonnet 4。
对于需要 AI 处理实时、低延迟任务的场景——比如聊天助手、客服代理或结对编程助手,Haiku 4.5 兼具高智能和出色速度,能带来更好的体验。
使用 Claude Code 的开发者也会发现,Haiku 4.5 让整个编程过程——从多智能体协作到快速原型开发——都变得更灵敏高效。
当然,两周前发的 Sonnet 4.5 依然是 Anthropic 的旗舰模型,归属全球编程模型第一档次。但 Haiku 4.5 提供了另一个选项:性能接近顶配,价格却亲民得多。
而且模型玩法更野了,Sonnet 4.5 可以把复杂问题拆成 N 个小任务,然后指挥一堆 Haiku 4.5 并行开工,这配合相当默契。
Anthropic 对 Haiku 4.5 进行了详细的安全性和对齐性测试。
结果显示,该模型的不良行为发生率较低,且比前代 Haiku 3.5 的对齐性显著提高。在自动化对齐评估中,Haiku 4.5 的总体偏离行为比 Sonnet 4.5 和 Opus 4.1 都更少。
也就是说,它目前是 Anthropic 家最安全的模型。
▲Comparison table of frontier models across popular benchmarks
至于价格嘛...Haiku 4.5 的定价为:每百万输入 token 1 美元,每百万输出 token 5 美元。
对比来看,GPT-5 mini 约为每百万输入 0.25 美元、输出 2.5 美元,Google 的 Gemini 2.5 Flash 价格差不多。也就是说,Haiku 4.5 的价格大约是 GPT-5 mini 或 Flash 的 4 倍。
不过跟 Sonnet 4.5 比,它便宜了约三倍,性能却几乎没差,这对开发者来说算是降本增效了。
但有一说一,数学不是它的强项。
知名博主 Dan Shipper 试用后发现,Haiku 在算术上有点... 迷糊。
比如在测试 Uber 账单的例子里,Haiku 虽然完美找出了所有相关邮件,但算总额时直接翻车。更尴尬的是,指出错误后它承认了——然后转头又犯了同样的错
Dan Shipper 给出的中肯评价是:
如果你是开发者或创业者,正在用 Sonnet 4.5 构建复杂的智能代理应用,现在可以考虑切换到 Haiku。你能节省大量成本,而性能损失几乎可以忽略。 如果你目前使用的是 Gemini 2.5 Flash 或 GPT-5 mini,建议试试 Haiku。虽然价格更高一些,但在需要调用工具和保持自主性的场景中,它的表现更好。
▲附上博客地址:https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked
目前,Claude Haiku 4.5 现已在 Claude Code 和各类应用中上线了。
开发者可以通过 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用 Haiku 4.5,直接替代 Haiku 3.5 和 Sonnet 4,而且价格是 Anthropic 最香的那档。
我们参考@zb1992 的提示词,让 Claude 4.5 Haiku 跑了一个钟表 Demo,整体体验下来,代码生成速度确实更快了,最终成品也令人满意。
在下文这个经典的推理计算题, Claude 4.5 Haiku 响应速度优势就更明显了,当然,这也正是轻量级模型在实际应用中的核心竞争力所在。
另外,据 The Information 报道,估值高达 1700 亿美元的 Anthropic 近几周已告诉投行顾问,计划通过收购引入新万博体育:技术人才,同时拓展除编程助手之外的能力——毕竟目前编程这块还是营收大头。
知情人士表示,鉴于 Anthropic 在向开发者提供编程类 AI 产品方面取得的成功,公司下一步可能会扩展至其他开发者常用的软件工具,比如自动测试代码漏洞的工具,或辅助软件设计的工具。
另有消息称,Anthropic 也可能通过收购开发面向特定行业的产品,例如金融服务、医疗保健或网络安全,不过他们更倾向于交易金额在 5 亿美元以下的小型收购项目。
目前看起来,在提升模型能力的同时,Anthropic 也在积极布局生态。AI 圈的你追我赶,最终受益的还是开发者和用户——更强的模型、更低的价格、新万博体育:的选择。
作者:莫崇宇
《手机赌钱手游》,《Q8X2R7L1T4J5M9B6W3》华体会体育棋牌
“二八杠网上哪里可以玩”
纬来体育好玩吗?
……
10月18日
“斗地主加倍是什么意思”肖战藏海传扶人下马车路透
↓↓↓
10月18日,中国地震局:新疆乌什7.1级地震位于天山地震带 为逆冲型破裂,澳门九五至尊网投网站,美高梅网投总站,雷竞技注册,足球现金网365
10月18日,唐山通报“烧烤店打人案出警民警举报”:其反映问题均不属实,威尼斯城娱乐在线注册,开元棋乐琪牌,亚星登陆,12bet快速注册
10月18日,半年“跨”出1.22万亿元!我国跨境电商这样跑出“加速度”,bob综合app官网版,扑克王app链接,威廉希尔在线投注,手机银河app下载
10月18日|创·造少年齐聚故宫 实践传统文化数字传承|日博官网365|明博体育客户端|俄罗斯世界杯买球平台|am8亚美平台
10月18日|在巴黎,34名“外教”与中国弟子共逐奥运梦|巴黎人电玩官网|万博官方网站登录|体育博官网|AG平台官网多少
10月18日|浙江绍兴出土“山阴”“会稽”地名遗物 最早溯至东汉|2021澳门足球报|易发棋牌官网|凯时登录官方网站|188bet……
10月18日,延安苹果进京推介,2023年全产业链综合产值破500亿元,蒲京娱乐平台,买球投注网站,可以的捕鱼,世界杯体育 官方网站
10月18日,【我们共芳华——党外人士话复兴】中国国家话剧院院长田沁鑫:我是个“i人”,但一排戏就变得犀利,3m官方网站,Ag官方网站,威斯尼斯网址官方网站,bet007即时比分
10月18日|德总理朔尔茨将于12月11日提出政府信任投票申请|yabo苹果版|永利体育手机版登陆|赢多多下载app|天天发娱乐官网下载安装
10月18日,央行明年继续推动降低企业和居民综合融资成本 最新解读→,威尼斯人最新网址,港澳报,乐虎国际官方网页,新濠的网址是多少
10月18日,四川合江:感受传统村落古建筑的魅力,狗万客户端登录,lc8乐橙手机版,老版斗牛牛游戏下载,买球的app有哪些
10月18日,世界卫生组织:全球烟草使用率持续下降,必赢电子游戏网址,世界杯足球 网站推荐,威尼斯人登陆官网,太阳陈新网址
10月18日|长江源头第一处国际重要湿地首次引秋冬迁徙斑头雁停歇|乐橙电子娱乐|凯时kb88官方注册账号|ayx官网是多少|365beat中文版
10月18日|海外中国青年:以青春之力践行报国之志|万博网址在哪找|纬来体育线路检测|博雅德州安卓下载|金沙亚洲手机版
10月18日|代表委员点赞美丽中国建设取得积极进展代表委员建议积极推进养老服务立法|爱游戏体育官网网页|88体育app官网苹果下载|电子打鱼|八路足球网
央视仍不转播国足的比赛,“冒牌教授”魏新河已被批捕|泰媒:一辆载中国游客巴士在泰国侧翻 至少17人受伤|安卓六狮森林舞会|金沙银河安卓版|AG真人计划网|BOB赌场网站
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺