猫眼电影
猫眼电影记者 莱克茜·库珀 报道Q8X2R7L1T4J5M9B6W3
就在OpenAI发布GPT-5.1,大谈“情商”之际,埃隆·马斯克(Elon Musk)也带着他的xAI,火速加入了这场“AI体验”之战。
就在刚刚,xAI宣布推出Grok 4.1,这是对现有Grok 4模型的重大升级,并已在grok.com、X平台以及iOS和Android应用向所有用户全面开放。。官方宣称,新版本在创意表达、情感互动和协同交流方面表现尤为突出,并且出现幻觉的概率仅为此前模型的三分之一。
更引人注目的是,在一个公开的“盲测”竞技场(LMArena)上,Grok 4.1的“思考模式”版本已悄然登顶总榜第一,甚至其“非推理”的快速模式,都击败了所有对手的“完整推理”模式。
这场突如其来的“榜首易主”,无疑为日趋白热化的AI竞赛,又增添了浓重的火药味。
Grok 4.1升级了什么?
xAI本次发布了两个Grok 4.1模型:Grok 4.1(非推理模式)和?Grok 4.1 Thinking(思考模式)。这两个模型均可免费使用,但付费用户面临的限制更少。
官方表示,新版本能更细致地理解隐含意图,与之对话引人入胜,也更能保持人设的一致性。
为了优化模型的风格、人格和有用性,xAI利用前沿的代理型推理模型(agentic reasoning models)作为“奖励模型”,在大规模环境中自主评估并迭代模型的回答。
在11月1日至14日的“静默上线”期间,xAI在真实流量上进行了盲测式的成对比较评估,结果显示,在64.78%的情况下,用户更偏好Grok 4.1。
“盲测”登顶,Grok 4.1到底有多强?
Grok 4.1在盲测的人类偏好评估中树立了新的行业标准。
LMArena是一个开源工具,用户可以通过并排、盲测的方式,比较不同大语言模型的表现。在这个竞争最激烈的“斗兽场”里,Grok 4.1取得了惊人的成绩:
· Grok 4.1的“思考模式”(代号:quasarflux)以1483 Elo的成绩位列总榜第一,领先所有非xAI模型31分。
· Grok 4.1的“非推理模式”(代号:tensor)无需使用“思考词元”(thinking tokens),可立即生成回答,并以1465 Elo的成绩排名第二。
· 更夸张的是,Grok 4.1的“非推理”模式表现,超过了所有其他模型在“完整推理模式”下的公开排行榜成绩。
与之相比, Grok 4此前在该榜单上的综合排名仅为第33位。
“情商”与“文采”,一个都不能少
除了通用能力,xAI还强调了新模型在“软实力”上的提升。
· 情绪智能(Emotional Intelligence) 为评估模型在个性与人际互动方面的进展,xAI对Grok 4.1进行了EQ-Bench3测试。这是一项由LLM作为裁判的测试,用于评估模型在主动情绪智能、理解力、洞察力、共情能力和人际技能方面的表现。
· 创意写作能力(Creative Writing) xAI同样测量了Grok 4.1在Creative Writing v3基准测试中的表现。在该测试中,模型需要根据32个不同的写作提示,在3次迭代中生成回答。
更少的“幻觉”
快速响应模型在配备搜索工具后,虽然能迅速给出答案,但更容易出现事实性错误。
在Grok 4.1的后训练阶段,xAI重点降低了模型在信息查询类提示中的事实性“幻觉”。
根据xAI的说法,Grok 4.1出现幻觉的概率是此前模型的三分之一,这使其成为xAI迄今为止的最佳版本之一。
为了验证这一点,xAI不仅在真实的生产流量中进行了评估,还使用了FActScore——一个包含500道新万博体育:人物传记问题的公开基准测试。
挑战与未来:真正的对手还在路上
尽管Grok 4.1的“盲测”成绩斐然,但AI的王座之争远未结束。
目前,我们尚不清楚它与GPT-5.1相比的真实表现。
更重要的是,谷歌(Google)正在准备发布Gemini 3.0,这可能会成为迄今为止最强大的模型。
Grok 4.1的发布,无疑是马斯克在AI竞赛中投下的一枚重要棋子。但在这场“神仙打架”的牌局中,谁能笑到最后,还远未可知。(易句)
(本文由AI翻译,网易编辑负责校对)
??时事1:体育365投注站
??11月15日,中国农业农村部部长:不断拓宽农民增收致富渠道,
一要学深学透,提高工作能力。 这次培训,安排内容注重实际工作,涉及的业务知识有较强的针对性和实用性。因此要通过认真的学习,按照科学发展观的要求,切实加强执政能力建设,提高工作实效。要进一步增强忧患意识和发展意识,坚持经济建设这个中心,聚精会神搞建设,一心一意谋发展,通过发展来解决前进中面临的问题和困难,自觉地把思想认识从那些不合时宜的观念、做法从体制的束缚中解放出来,以创新促发展,以创新求突破,大力创新工作思路、工作载体和工作方法,努力实现我街道经济社会在更高平台上的新发展。
,澳洲看世界杯的网站。??11月15日,美国总统国家安全事务助理沙利文将访华,
一、总结回顾此次换届选举工作
,188bet金宝搏体育外围,必威官方下载,AG官方入口。??时事2:万博手机版登录地址
??11月15日,中国自主研发的HH-100航空商用无人运输系统验证机成功首飞,
4、不暴饮暴食,注意饮食卫生,不在剧烈运动后大量喝凉水。不购买“三无产品”(无生产日期,无生产厂家,无卫生许可证),不随便在路边小摊、卫生不好的地方乱吃东西,不吃过期、有毒、腐烂、变质的东西,预防食物中毒。注意个人卫生,尽量不要外出,不到人群集中的地方去,预防传染病。
,龙8登录网站,华夏棋牌游戏官网,亚星官网注册开户。??11月15日,上海:“家门口”服务不断优化 居民幸福持续“加码”,
小孤山镇,诸强骇然,因为连他们都听到了山脉深处的声音,抬眼望去,那里一片混沌气缭绕,十几块兽骨镇压了无垠的山脉,无人能看穿。
,世界杯外盘投注比例,赌博的网址有哪些,八方体育娱乐。??时事3:sbobet登录
??11月15日,【百万庄小课堂】北方迎来今年最强高温天气 不慎中暑如何急救?,
强如石林虎、石飞蛟这样的猛人,也算不得这个境界的人,因为太难了,一万人的部落中能有一人迈过这道槛就不错了。
,皇冠买球app下载平台,欧宝app最新,银河国际游戏。??11月15日,巴西东南部车祸致8亡43伤,
到了最后,金色狻猊越来越凶,撞的黑鼎轰鸣,不断抖动,可也就是这时此鼎亦发生了变化,上面的日月山河与鸟兽鱼虫等竟真实了很多,像是要复活了。
,会员料,新萄京娱乐手机版,开心斗地主真人版。??时事4:伟德官网手机版
??11月15日,大运河上练“水上漂”当事人被杭州交通部门约谈,
小不点一惊,但是并没有恐惧,双手划动,指端浮现一片纹络,组成一个小月牙,被他握在了掌心中,猛力一挥,点点光辉扩散,将所有弩箭全部击碎。
,亚美体育下载安装,乐鱼体育网页版链接,手机必赢亚洲登录官网。??11月15日,农民致富 乡村振兴,
度过了一个平安、愉快的春节寒假,我们满怀着新的希望迎来了生机勃勃的20xx年春季学期,回首过去的一年,我们步履坚实,洒下了汗水,收获了喜悦,取得了可喜的成绩。我们开展了多种形式安全教育活动,提高了安全意识,增强了自我防范能力,全校师生团结一致,共同努力,杜绝了安全事故的发生,确保了我校师生的生命财产安全。
,体育盘口平台,365bet线上APP,巴黎人官网可以注册吗。责编:马太·约翰逊
审核:韦德波尔
责编:萨姆特












