2025-10-16 04:45:59 1,934次浏览

就在刚刚,Anthropic 发布了 Claude Haiku 4.5。

先简单科普一下,Claude 家族有三个不同参数量级的模型:Claude Opus(大杯)、Sonnet(中杯)和 Haiku(小杯)。

这次更新最大的看点是,小杯 Claude Haiku 4.5 在模型性能保持高水准的同时,速度更快、价格更便宜了。

五个月前,Claude Sonnet 4 还是最先进的模型之一。现在新出的 Haiku 4.5 在编码性能上几乎和它打平手,但价格只要三分之一,速度还翻了两倍多。

▲Chart comparing frontier models on SWE-bench Verified which measures performance on real-world coding tasks

具体来说,在用于衡量 AI 编码能力的测试集 SWE-bench Verified 上,Haiku 4.5 取得了 73% 的成绩,什么概念?直接跟 Claude Sonnet 4 以及 OpenAI 最新的 GPT-5 站在同一水平线上。

在某些任务比如操控电脑方面,Haiku 4.5 甚至反杀了老大哥 Sonnet 4。

对于需要 AI 处理实时、低延迟任务的场景——比如聊天助手、客服代理或结对编程助手,Haiku 4.5 兼具高智能和出色速度,能带来更好的体验。

使用 Claude Code 的开发者也会发现,Haiku 4.5 让整个编程过程——从多智能体协作到快速原型开发——都变得更灵敏高效。

当然,两周前发的 Sonnet 4.5 依然是 Anthropic 的旗舰模型,归属全球编程模型第一档次。但 Haiku 4.5 提供了另一个选项:性能接近顶配,价格却亲民得多。

而且模型玩法更野了,Sonnet 4.5 可以把复杂问题拆成 N 个小任务,然后指挥一堆 Haiku 4.5 并行开工,这配合相当默契。

Anthropic 对 Haiku 4.5 进行了详细的安全性和对齐性测试。

结果显示,该模型的不良行为发生率较低,且比前代 Haiku 3.5 的对齐性显著提高。在自动化对齐评估中,Haiku 4.5 的总体偏离行为比 Sonnet 4.5 和 Opus 4.1 都更少。

也就是说,它目前是 Anthropic 家最安全的模型。

▲Comparison table of frontier models across popular benchmarks

至于价格嘛...Haiku 4.5 的定价为:每百万输入 token 1 美元,每百万输出 token 5 美元。

对比来看,GPT-5 mini 约为每百万输入 0.25 美元、输出 2.5 美元,Google 的 Gemini 2.5 Flash 价格差不多。也就是说,Haiku 4.5 的价格大约是 GPT-5 mini 或 Flash 的 4 倍。

不过跟 Sonnet 4.5 比,它便宜了约三倍,性能却几乎没差,这对开发者来说算是降本增效了。

但有一说一,数学不是它的强项。

知名博主 Dan Shipper 试用后发现,Haiku 在算术上有点... 迷糊。

比如在测试 Uber 账单的例子里,Haiku 虽然完美找出了所有相关邮件,但算总额时直接翻车。更尴尬的是,指出错误后它承认了——然后转头又犯了同样的错

Dan Shipper 给出的中肯评价是:

如果你是开发者或创业者,正在用 Sonnet 4.5 构建复杂的智能代理应用,现在可以考虑切换到 Haiku。你能节省大量成本,而性能损失几乎可以忽略。 如果你目前使用的是 Gemini 2.5 Flash 或 GPT-5 mini,建议试试 Haiku。虽然价格更高一些,但在需要调用工具和保持自主性的场景中,它的表现更好。

▲附上博客地址:https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked

目前,Claude Haiku 4.5 现已在 Claude Code 和各类应用中上线了。

开发者可以通过 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用 Haiku 4.5,直接替代 Haiku 3.5 和 Sonnet 4,而且价格是 Anthropic 最香的那档。

我们参考@zb1992 的提示词,让 Claude 4.5 Haiku 跑了一个钟表 Demo,整体体验下来,代码生成速度确实更快了,最终成品也令人满意。

在下文这个经典的推理计算题, Claude 4.5 Haiku 响应速度优势就更明显了,当然,这也正是轻量级模型在实际应用中的核心竞争力所在。

另外,据 The Information 报道,估值高达 1700 亿美元的 Anthropic 近几周已告诉投行顾问,计划通过收购引入新万博体育:技术人才,同时拓展除编程助手之外的能力——毕竟目前编程这块还是营收大头。

知情人士表示,鉴于 Anthropic 在向开发者提供编程类 AI 产品方面取得的成功,公司下一步可能会扩展至其他开发者常用的软件工具,比如自动测试代码漏洞的工具,或辅助软件设计的工具。

另有消息称,Anthropic 也可能通过收购开发面向特定行业的产品,例如金融服务、医疗保健或网络安全,不过他们更倾向于交易金额在 5 亿美元以下的小型收购项目。

目前看起来,在提升模型能力的同时,Anthropic 也在积极布局生态。AI 圈的你追我赶,最终受益的还是开发者和用户——更强的模型、更低的价格、新万博体育:的选择。

作者:莫崇宇

(2秒轻松上手)99精品久久只有精品做人人安卓版v81.12.40.6.46.19.00.61-2265安卓网_新万博体育

新万博体育

图片 Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5
Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5

Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5

「统计」Q8X2R7L1T4J5M9B6W3

371.10MB
版本V1.1.26
下载姐姐洗澡被弟弟c到高潮安装你想要的应用 更方便 更快捷 发现新万博体育:
喜欢 25%好评(53095人)
评论 20
Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5截图0 Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5截图1 Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5截图2 Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5截图3 Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5截图4
详细信息
  • 软件大小: 29253.39706MB
  • 最后更新: 2025-10-16 04:45:59
  • 最新版本: V3.61204.2
  • 文件格式: apk
  • 应用分类:ios-Android 午夜理论2021理论无码
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 8.51003以上
应用介绍
一,国产户外自拍丝袜a片黄色片,色妞一二三区在线观
二,妓女8888精品视频,桃花岛成在人线av
三,欧美性爱性爱,无码va真人一级毛片免费
四,特级毛片A级毛片免费播放视频,GayGay大肉大捧
五,美女被ⅹ网站免费,不用免费的操逼视频
六,A片视频免费观看网站,免费激情a片网址,好男人WWW.Com
七,免费看裸体美女
【联系我们】
客服热线:134-2881-646
加载新万博体育:
版本更新
V2.1.36
无遮巨屌在线免费观看

18黃色网站 类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
包含 饿了么 的应用集
评论
  • www.色99色 9天前
    中文字幕第一页在线日本
  • 亚洲麻烦在线视频 2天前
    日本学生扒裙子打光屁股
  • 金国产精品白丝AV网站在线观看 5天前
    漂亮姑娘一级黄色
  • 9.1菠萝 5天前
    久久国产免费黄色视频
  • 免费精品网站在线免费观看 5天前
    黄色免费在线观看
  • 国产老肥熟XXxX 1天前
    国产办公室在线视频
  • 情色免费网站 5天前
    日本午夜理伦三级在线观看
  • A级大片免费高新 5天前
    人人看人人草人人搞人人鲁人人插
  • 欧美少妇A片 9天前
    贵在真实 稀缺的
  • 爱爱视频午夜 6天前
    欧美老妇与小伙性交