v1.569.4328 安卓免費版
v1.964.8871 安卓最新版
v8.28 IOS版
v9.822.4169.877175 IOS版
v9.774 PC版
v9.950.8287.754544 安卓版
v4.992.8684.849053 安卓漢化版
v4.182.2634.749509 最新版
v5.299.9539 IOS版
v8.678.6210.554209 IOS版
v7.988.68.879458 PC版
v2.507.3329.440781 安卓漢化版
v6.909 安卓版
v8.576.1717.884518 最新版
v5.970.5094.568536 安卓版
v4.795.8056.246325 PC版
v8.628 安卓免費版
v4.402 安卓免費版
v7.330.8879 安卓免費版
v2.763.9484 IOS版
v5.928.5338.958579 安卓漢化版
v9.982.4619.228958 安卓免費版
v2.482.2638.515119 最新版
v6.575.2905.104547 最新版
v4.519.3521.781187 安卓版
v6.224 安卓最新版
v7.709.4881.595121 安卓最新版
v5.671.802 IOS版
v4.857.1941 PC版
v1.830.2959.248615 安卓版
v6.193.4174.682188 IOS版
v2.195.7879 最新版
v4.939.2070 安卓免費版
v8.985.5743 安卓版
v7.217.6602.557967 最新版
v3.31.6220.412686 PC版
v5.225.4327.711673 安卓漢化版
v5.566 IOS版
v3.570.6164 PC版
v5.64.5066.970513 PC版
v2.246.2085 PC版
v5.811 PC版
v4.885 最新版
v3.929.3772 最新版
v6.465.3136 安卓最新版
v1.733 IOS版
v5.23.2659.800146 最新版
v7.411.5163 PC版
v7.556.9915.258925 最新版
v3.633.8428.487300 最新版
v4.845 安卓免費版
v2.144.5141 安卓免費版
v7.246 IOS版
v9.933.9261.353339 IOS版
v1.56.119.712517 IOS版
v2.747.8943.444074 PC版
v8.595 最新版
v5.54.2945.39495 PC版
v5.484.5829 安卓免費版
v7.428.2121.324782 IOS版
v2.795.1080 最新版
v3.889.373.257597 IOS版
v1.838.6517.213231 安卓最新版
v2.986.8472 安卓免費版
v9.223 最新版
v1.544.9690 安卓版
v7.842.7031.3376 最新版
v4.148.2707.692863 安卓漢化版
v1.973.5975.199427 最新版
v7.722 IOS版
v4.185.7167 IOS版
v1.325 安卓最新版
v7.186.3278.307391 安卓免費版
v1.403.2068 安卓最新版
v2.775 安卓免費版
v8.175 安卓版
v5.144.1162.546983 PC版
v1.375.6225 IOS版
v8.805 安卓版
v6.65.7291.813031 PC版
捕鱼星力
一、重磅工具:“空间智能”正式上线,AI开始自己造世界
新闻:World Labs发布世界模型Marble。这个生成式AI世界模型允许用户根据文本、图像、视频和3D布局等多种输入,生成可持续交互的3D环境。这些模型基于渲染场景中的高斯溅射特征生成3D世界,能在用户探索时保持一致性。
World Labs一直在开发能够突破空间智能边界的世界模型,其理念基于该公司创始人李飞飞所提出的“空间智能是AI下一个前沿”。空间智能是AI理解物理世界的基础,支持创建和编辑交互式AI世界;这项技术有望成为一种基础性的AI模型技术,既能服务于视频和图像的生成式AI模型,也能支持机器人和自动驾驶汽车等与物理世界交互的AI模型。
锐评:这是要造出《黑客帝国》母体的节奏。
二、AI技术与产品发布:从会说话到会“说人话”,个性成GPT-5.1新亮点
1. 新闻:本周OpenAI发布GPT-5.1。作为GPT-5的更新版,GPT-5.1旨在实现更“富有人情味”的交互体验。它提供两种主要模式:GPT-5.1 Instant (即时模式),用于快速、热情、遵循指令的聊天;以及GPT-5.1 Thinking(思考模式),用于更持久的多步骤推理。即时模式能提供快速、友好的回答,而思考模式则会在处理复杂任务时自动放慢速度。而在“自动”模式下,ChatGPT会自动将用户任务分配给最合适的模式。
GPT-5.1还包含一套更丰富的个性预设(默认、专业、友好、坦诚、古怪、高效、书呆子气、尖酸刻薄),让用户可以通过设置微调回复的语气。GPT-5.1的发布公告并未提及新模型的推理或基准测试能力有何具体提升,而旧版GPT-5模型将会保留数月时间。
评测指出,GPT-5.1感觉更“温暖”、更具个性化,解决了此前GPT-5缺乏个性的问题,在交互式聊天中对指令的响应和遵循能力也有所改善。TechRadar的日常使用评测称GPT-5.1“能力更强且更可控”。Digital Trends则表示:“我更喜欢用Gemini,但GPT-5.1更新可能会让ChatGPT成为你真正想用的AI助手。”
OpenAI还扩展了ChatGPT的协作功能,允许多人与同一个AI对话。GPT-5.1中的这项功能主要针对项目工作、规划和学习小组的需求,允许用户邀请朋友加入进行中的ChatGPT对话,并看到AI结合上下文回复每个人的消息。
锐评:GPT情商拉满,终于学会“好好说话”了。
2. 新闻:百度发布ERNIE-4.5-VL-28B-A3B-Thinking,这是一个基于混合专家(MoE)架构的新型多模态推理模型。其总参数量为280亿,但每个token仅激活30亿参数。ERNIE-4.5-VL-28B-A3B-Thinking能够处理图表理解、视频理解、视觉定位和工具增强的图像搜索等视觉推理任务。在MathVista和其他VQA(视觉问答)套件等基准测试中,它的表现与Gemini 2.5 Pro和GPT-5.1相当,但模型规模要小得多。ERNIE-4.5-VL-28B-A3B-Thinking基于Apache 2.0开源许可协议,其文档、演示以及权重已同步上线Hugging Face。
锐评:百度这波“以小博大”,证明“浓缩就是精华”,顺手还给开源了。
3. 新闻:ElevenLabs推出Scribe v2 Realtime,这是该公司最新的用于实时转录的低延迟语音转文本模型。Scribe v2 Realtime能以低于150毫秒的延迟转录语音,目标应用场景包括语音助手、会议助手和实时字幕,并支持90多种语言。ElevenLabs为使用其API的用户和开发者提供了产品页面和技术文档。
锐评:话音未落,已转录成文。
4. 新闻:谷歌更新Android和iOS平台上的Gemini Live,提供更具适应性和表现力的语音功能。用户现在可以调整语速,听到更细微的语调和节奏变化,还可以要求AI用不同角色的口音来讲故事。新版应用还改进了AI对语言学习和练习对话的支持。此外,Gemini Live API中新增的本地音频模型降低了延迟,提升了语音优先应用的性能。
锐评:除了不像人会喘气,啥音都会。
5. 新闻:谷歌在其搜索的AI模式以及Gemini应用中推出了一整套AI购物工具。对话式购物功能可以从包含约500亿个产品列表的图谱中提取信息;“智能结账”功能可跟踪价格,并在商品价格降至用户设定阈值以下时通过Google Pay自动下单;“让Google致电”的智能体功能可代替用户致电本地商店,查询库存和促销信息。
锐评:这下网购花钱更快了。
6. 新闻:Terminal-Bench基准测试已更新至2.0版。Terminal-Bench是一个开源基准测试,包含89个实际终端任务,用于评估AI智能体在真实Shell环境中的操作能力。Terminal-Bench团队还发布了基于容器的标准框架Harbor,可以让不同智能体在相同任务上进行可复现的评估。Terminal-Bench的公开排行榜会跟踪各智能体在终端AI自动化任务上的表现。
锐评:智能体考试也越来越难,还要比拼敲命令行。
7. 新闻:总部位于巴黎的H Company公司发布新一代多模态模型Holo Two,旨在推动跨平台的计算机使用智能体。Holo Two模型有40亿、80亿和300亿-A3B MoE三种规模,均是经过调优的视觉语言模型,用于在真实GUI(图形用户界面)中进行定位、导航和任务执行。这些模型使智能体能够“查看”屏幕,并通过点击和按键来控制屏幕;它们可以在网页、桌面以及移动端运行。Holo Two模型现已开放权重并上线Hugging Face平台。
锐评:能看屏幕、能点按钮、能跑GUI,这不是把坐办公室的活全包了嘛。
8. 新闻:新发布的Robyn是前医生Jenny Shao创建的一款富有同理心的AI伴侣。作为一款iOS应用,Robyn的定位并非替代心理医生,而是一个高情商的伙伴。它能记住用户的详细信息,具备长期跟踪模式,可以提供新万博体育:压力、情感依恋风格和习惯方面的见解,同时为了确保安全还内置了防护措施和危机响应流程。
锐评:明明白白你的心,渴望一份真感情。
9. 新闻:Gemini 3和Nano Banana 2即将发布。Gemini 3预览版现已在LMArena上线,代号为“riftrunner”。谷歌新一代AI图像模型Nano Banana 2也已以预览形式出现在Gemini应用内。Nano Banana 2在角度和视点方面具备更强的类相机控制,改进了文本渲染能力,并采用多步骤的“规划、生成、评估、修复”工作流,在呈现最终结果前会反复自我修正图像。
锐评:还会反复纠错,AI出图这是要卷到用户满意为止。
三、AI研究动态:小模型打出大智慧,多语言多环境AI纷纷出炉
1. 新闻:Meta推出语音识别系统Omnilingual ASR,能支持超过1600种语言和方言。Meta表示,Omnilingual ASR是“被设计成一个社区驱动的框架”,其中包含一套用于自动语音识别 (ASR) 的新型开源AI模型和一个涵盖350种冷门小语种的转录语音数据集。这些AI模型的参数量从3.5亿到70亿不等,均基于Meta的wav2vec 2.0架构开发。Meta在论文《Omnilingual ASR:支持1600多种语言的开源多语言语音识别》中公布了他们的研究成果。
锐评:能不能听懂我们的温州话?
2. 新闻:微博AI发布VibeThinker-1.5B,并在论文《小模型,大逻辑:多样性驱动优化在VibeThinker-1.5B中激发大模型推理能力》一文中对其进行了介绍。VibeThinker-1.5B是一个15亿参数的推理模型,针对数学和逻辑任务进行了优化,在数学推理基准测试中的得分超过许多大模型。这款AI模型采用多样性驱动的优化策略,能从规模更小的网络中激发出大模型风格的推理行为。
锐评:证明参数不是一切,大模型被啪啪打脸。
3. 新闻:谷歌DeepMind推出基于Gemini的智能体SIMA 2,它可在3D虚拟世界和商业游戏中运行,通过感知屏幕和控制键盘鼠标来执行任务。据描述,新版比SIMA 1更通用且自我改进能力更强,能够处理先前没见过的环境和更复杂的任务。目前SIMA 2仍是一个研究性AI模型,但被DeepMind视为迈向通用智能体、可在丰富模拟环境中通过交互进行学习的重要一步。
锐评:SIMA 2靠“看屏幕、敲键鼠”就能通关,人类玩家的“高光时刻”不多了。
四、AI商业与政策:淘金热度不减,连杨立昆也坐不住了?
1. 新闻:Anthropic宣布将在未来十年向美国AI基础设施投资500亿美元,在得克萨斯州和纽约州建立AI数据中心,以满足30多万商业客户对Claude日益增长的需求。这些项目预计将创造约800个永久性工作岗位和2400个建筑工作岗位,也符合美国保持先进计算领域领导地位的AI战略。
锐评:哪是训练Claude,这分明是在用钞票给AI筑巢。
2. 新闻:Meta首席AI科学家杨立昆(Yann LeCun)计划离开Meta,创办自己的公司。他的离职反映出Meta AI团队的人事动荡;但这也可能是机遇,或将催生出一个更注重研究的AI实验室,追求的成果完全不同于那些专注于大语言模型的AI公司。
锐评:小扎的钞能力不好用了?
3. 新闻:AI原生代码编辑器开发商Cursor宣布完成23亿美元D轮融资,估值达到293亿美元。该公司现已用其热门产品Cursor给自己命名,据称2025年营收增长了100倍,并表示年化营收突破10亿美元大关,客户包括数百万开发者和许多全球顶尖的工程组织。考虑到Cursor惊人的营收增幅,高达290亿美元的估值也就不足为奇了。
锐评:AI时代最赚钱的不是造AI,而是给造AI的“码农”造工具。
4. 新闻:欧洲数据保护监察局 (EDPS) 发布AI风险管理指导文件,为欧盟机构提供在数据保护法框架下如何管理AI系统风险的实用指南。这份名为《AI系统风险管理指南》的文件概述了在公共部门部署AI时进行风险评估、文档记录和人工监督的步骤,并将指导意见与《通用数据保护条例》的义务和欧盟最新的《AI法案》对齐。
锐评:模型还没跑起来,文件倒出了不少。
五、AI观点与文章:狂飙之后,该谁来付“电费”
新闻:彭博社专栏作家警告称,随着超大规模云服务商纷纷锁定数据中心所需的大量能源供应,AI“电力争夺”正与能源可负担性发生冲突。如果AI电力需求上涨冲击到能源价格,可能会引发公众的强烈反对和监管介入。
这种担忧并非首次出现,但政策制定者和企业需要解决谁来为AI能源需求背后的基础设施买单的问题。否则公众反对建设AI数据中心的声音将会越来越大。
锐评:再不解决“电费谁出”的问题,小心公众拔插头。(辰辰)
相关版本
多平台下载
查看所有0条评论>网友评论