捕鱼星力

电脑版下载

29516
6

捕鱼星力截图Q8X2R7L1T4J5M9B6W3

内容详情

捕鱼星力

一、重磅工具：“空间智能”正式上线，AI开始自己造世界

新闻：World Labs发布世界模型Marble。这个生成式AI世界模型允许用户根据文本、图像、视频和3D布局等多种输入，生成可持续交互的3D环境。这些模型基于渲染场景中的高斯溅射特征生成3D世界，能在用户探索时保持一致性。

World Labs一直在开发能够突破空间智能边界的世界模型，其理念基于该公司创始人李飞飞所提出的“空间智能是AI下一个前沿”。空间智能是AI理解物理世界的基础，支持创建和编辑交互式AI世界；这项技术有望成为一种基础性的AI模型技术，既能服务于视频和图像的生成式AI模型，也能支持机器人和自动驾驶汽车等与物理世界交互的AI模型。

锐评：这是要造出《黑客帝国》母体的节奏。

二、AI技术与产品发布：从会说话到会“说人话”，个性成GPT-5.1新亮点

1. 新闻：本周OpenAI发布GPT-5.1。作为GPT-5的更新版，GPT-5.1旨在实现更“富有人情味”的交互体验。它提供两种主要模式：GPT-5.1 Instant （即时模式），用于快速、热情、遵循指令的聊天；以及GPT-5.1 Thinking（思考模式），用于更持久的多步骤推理。即时模式能提供快速、友好的回答，而思考模式则会在处理复杂任务时自动放慢速度。而在“自动”模式下，ChatGPT会自动将用户任务分配给最合适的模式。

GPT-5.1还包含一套更丰富的个性预设（默认、专业、友好、坦诚、古怪、高效、书呆子气、尖酸刻薄），让用户可以通过设置微调回复的语气。GPT-5.1的发布公告并未提及新模型的推理或基准测试能力有何具体提升，而旧版GPT-5模型将会保留数月时间。

评测指出，GPT-5.1感觉更“温暖”、更具个性化，解决了此前GPT-5缺乏个性的问题，在交互式聊天中对指令的响应和遵循能力也有所改善。TechRadar的日常使用评测称GPT-5.1“能力更强且更可控”。Digital Trends则表示：“我更喜欢用Gemini，但GPT-5.1更新可能会让ChatGPT成为你真正想用的AI助手。”

OpenAI还扩展了ChatGPT的协作功能，允许多人与同一个AI对话。GPT-5.1中的这项功能主要针对项目工作、规划和学习小组的需求，允许用户邀请朋友加入进行中的ChatGPT对话，并看到AI结合上下文回复每个人的消息。

锐评：GPT情商拉满，终于学会“好好说话”了。

2. 新闻：百度发布ERNIE-4.5-VL-28B-A3B-Thinking，这是一个基于混合专家（MoE）架构的新型多模态推理模型。其总参数量为280亿，但每个token仅激活30亿参数。ERNIE-4.5-VL-28B-A3B-Thinking能够处理图表理解、视频理解、视觉定位和工具增强的图像搜索等视觉推理任务。在MathVista和其他VQA（视觉问答）套件等基准测试中，它的表现与Gemini 2.5 Pro和GPT-5.1相当，但模型规模要小得多。ERNIE-4.5-VL-28B-A3B-Thinking基于Apache 2.0开源许可协议，其文档、演示以及权重已同步上线Hugging Face。

锐评：百度这波“以小博大”，证明“浓缩就是精华”，顺手还给开源了。

3. 新闻：ElevenLabs推出Scribe v2 Realtime，这是该公司最新的用于实时转录的低延迟语音转文本模型。Scribe v2 Realtime能以低于150毫秒的延迟转录语音，目标应用场景包括语音助手、会议助手和实时字幕，并支持90多种语言。ElevenLabs为使用其API的用户和开发者提供了产品页面和技术文档。

锐评：话音未落，已转录成文。

4. 新闻：谷歌更新Android和iOS平台上的Gemini Live，提供更具适应性和表现力的语音功能。用户现在可以调整语速，听到更细微的语调和节奏变化，还可以要求AI用不同角色的口音来讲故事。新版应用还改进了AI对语言学习和练习对话的支持。此外，Gemini Live API中新增的本地音频模型降低了延迟，提升了语音优先应用的性能。

锐评：除了不像人会喘气，啥音都会。

5. 新闻：谷歌在其搜索的AI模式以及Gemini应用中推出了一整套AI购物工具。对话式购物功能可以从包含约500亿个产品列表的图谱中提取信息；“智能结账”功能可跟踪价格，并在商品价格降至用户设定阈值以下时通过Google Pay自动下单；“让Google致电”的智能体功能可代替用户致电本地商店，查询库存和促销信息。

锐评：这下网购花钱更快了。

6. 新闻：Terminal-Bench基准测试已更新至2.0版。Terminal-Bench是一个开源基准测试，包含89个实际终端任务，用于评估AI智能体在真实Shell环境中的操作能力。Terminal-Bench团队还发布了基于容器的标准框架Harbor，可以让不同智能体在相同任务上进行可复现的评估。Terminal-Bench的公开排行榜会跟踪各智能体在终端AI自动化任务上的表现。

锐评：智能体考试也越来越难，还要比拼敲命令行。

7. 新闻：总部位于巴黎的H Company公司发布新一代多模态模型Holo Two，旨在推动跨平台的计算机使用智能体。Holo Two模型有40亿、80亿和300亿-A3B MoE三种规模，均是经过调优的视觉语言模型，用于在真实GUI（图形用户界面）中进行定位、导航和任务执行。这些模型使智能体能够“查看”屏幕，并通过点击和按键来控制屏幕；它们可以在网页、桌面以及移动端运行。Holo Two模型现已开放权重并上线Hugging Face平台。

锐评：能看屏幕、能点按钮、能跑GUI，这不是把坐办公室的活全包了嘛。

8. 新闻：新发布的Robyn是前医生Jenny Shao创建的一款富有同理心的AI伴侣。作为一款iOS应用，Robyn的定位并非替代心理医生，而是一个高情商的伙伴。它能记住用户的详细信息，具备长期跟踪模式，可以提供新万博体育：压力、情感依恋风格和习惯方面的见解，同时为了确保安全还内置了防护措施和危机响应流程。

锐评：明明白白你的心，渴望一份真感情。

9. 新闻：Gemini 3和Nano Banana 2即将发布。Gemini 3预览版现已在LMArena上线，代号为“riftrunner”。谷歌新一代AI图像模型Nano Banana 2也已以预览形式出现在Gemini应用内。Nano Banana 2在角度和视点方面具备更强的类相机控制，改进了文本渲染能力，并采用多步骤的“规划、生成、评估、修复”工作流，在呈现最终结果前会反复自我修正图像。

锐评：还会反复纠错，AI出图这是要卷到用户满意为止。

三、AI研究动态：小模型打出大智慧，多语言多环境AI纷纷出炉

1. 新闻：Meta推出语音识别系统Omnilingual ASR，能支持超过1600种语言和方言。Meta表示，Omnilingual ASR是“被设计成一个社区驱动的框架”，其中包含一套用于自动语音识别 (ASR) 的新型开源AI模型和一个涵盖350种冷门小语种的转录语音数据集。这些AI模型的参数量从3.5亿到70亿不等，均基于Meta的wav2vec 2.0架构开发。Meta在论文《Omnilingual ASR：支持1600多种语言的开源多语言语音识别》中公布了他们的研究成果。

锐评：能不能听懂我们的温州话？

2. 新闻：微博AI发布VibeThinker-1.5B，并在论文《小模型，大逻辑：多样性驱动优化在VibeThinker-1.5B中激发大模型推理能力》一文中对其进行了介绍。VibeThinker-1.5B是一个15亿参数的推理模型，针对数学和逻辑任务进行了优化，在数学推理基准测试中的得分超过许多大模型。这款AI模型采用多样性驱动的优化策略，能从规模更小的网络中激发出大模型风格的推理行为。

锐评：证明参数不是一切，大模型被啪啪打脸。

3. 新闻：谷歌DeepMind推出基于Gemini的智能体SIMA 2，它可在3D虚拟世界和商业游戏中运行，通过感知屏幕和控制键盘鼠标来执行任务。据描述，新版比SIMA 1更通用且自我改进能力更强，能够处理先前没见过的环境和更复杂的任务。目前SIMA 2仍是一个研究性AI模型，但被DeepMind视为迈向通用智能体、可在丰富模拟环境中通过交互进行学习的重要一步。

锐评：SIMA 2靠“看屏幕、敲键鼠”就能通关，人类玩家的“高光时刻”不多了。

四、AI商业与政策：淘金热度不减，连杨立昆也坐不住了？

1. 新闻：Anthropic宣布将在未来十年向美国AI基础设施投资500亿美元，在得克萨斯州和纽约州建立AI数据中心，以满足30多万商业客户对Claude日益增长的需求。这些项目预计将创造约800个永久性工作岗位和2400个建筑工作岗位，也符合美国保持先进计算领域领导地位的AI战略。

锐评：哪是训练Claude，这分明是在用钞票给AI筑巢。

2. 新闻：Meta首席AI科学家杨立昆（Yann LeCun）计划离开Meta，创办自己的公司。他的离职反映出Meta AI团队的人事动荡；但这也可能是机遇，或将催生出一个更注重研究的AI实验室，追求的成果完全不同于那些专注于大语言模型的AI公司。

锐评：小扎的钞能力不好用了？

3. 新闻：AI原生代码编辑器开发商Cursor宣布完成23亿美元D轮融资，估值达到293亿美元。该公司现已用其热门产品Cursor给自己命名，据称2025年营收增长了100倍，并表示年化营收突破10亿美元大关，客户包括数百万开发者和许多全球顶尖的工程组织。考虑到Cursor惊人的营收增幅，高达290亿美元的估值也就不足为奇了。

锐评：AI时代最赚钱的不是造AI，而是给造AI的“码农”造工具。

4. 新闻：欧洲数据保护监察局 (EDPS) 发布AI风险管理指导文件，为欧盟机构提供在数据保护法框架下如何管理AI系统风险的实用指南。这份名为《AI系统风险管理指南》的文件概述了在公共部门部署AI时进行风险评估、文档记录和人工监督的步骤，并将指导意见与《通用数据保护条例》的义务和欧盟最新的《AI法案》对齐。

锐评：模型还没跑起来，文件倒出了不少。

五、AI观点与文章：狂飙之后，该谁来付“电费”

新闻：彭博社专栏作家警告称，随着超大规模云服务商纷纷锁定数据中心所需的大量能源供应，AI“电力争夺”正与能源可负担性发生冲突。如果AI电力需求上涨冲击到能源价格，可能会引发公众的强烈反对和监管介入。

这种担忧并非首次出现，但政策制定者和企业需要解决谁来为AI能源需求背后的基础设施买单的问题。否则公众反对建设AI数据中心的声音将会越来越大。

锐评：再不解决“电费谁出”的问题，小心公众拔插头。（辰辰）