澳门太阳集团城网址55,海量高清资源免费畅享,热门影视综艺一网打尽

首页 >新闻 >社会新闻

Google 首席 AI 架构师：Gemini 逆风翻盘的18个关键

2025-11-23 14:50:18

来源：

猫眼电影

作者：

于长城

手机查看

　　猫眼电影记者吉扎西报道Q8X2R7L1T4J5M9B6W3

如果不是亲耳听到，很难想象一家科技巨头会在镜头前承认：“两年半前，我们远远落后了。”在这次访谈里，DeepMind CTO、Google 首席 AI 架构师 Koray Kavukcuoglu 罕见地拆开了过去两年 Google 的真实处境——不是领先、不是规模，而是被时代加速甩在身后、再一点点追上来的过程。

他没有炫耀参数，也没有谈模型的“神迹”，而是把重点放在更底层、更残酷的问题上：一家全球最强的 AI 实验室，如何在巨大的惯性中重新学会创新、学会工程化、学会组织协作、学会把技术真正变成产品？

Gemini 的故事只是表层。真正发生变化的，是 Google 这家公司的骨架与节奏。

原文访谈链接：https://www.youtube.com/watch?v=fXtna7UrL44以下是根据访谈实录整理的关键议题，希望也能帮你更清晰地读懂 Google 的这次“重构”。

一、真正的起点不是突破，而是承认自己落后了

访谈中最刺耳也最重要的一句话，出现在结尾：

“当 Gemini 项目开始时，我们离最先进水平还很远，那是一个追赶。”

这句话标志着一个巨大的认知转折：Google 承认自己在 LLM 起跑线上是真正的落后者。不是“状态不好”这种轻描淡写，而是“远远落后”。这意味着 DeepMind 必须抛弃此前十年建立的自信，从最基础的用户使用场景重新学习。

而这种承认，是一切变化的源头。Koray 在访谈里反复强调：真正的转折不是某个新技术，而是 Google 接受自己必须重新建立训练方式、产品方式、工程方式以及组织方式。

二、为什么中国用户最先明显感觉到 Gemini 变好了？

访谈一开始，主持人提到一个特别中国的反馈：Gemini 3 在中国用户中被形容为“像 Windows XP 一样稳定好使”。Koray 很有兴致地解释，这不是模型本身突然“智商暴涨”，而是 Google 终于把“模型 × UI × 任务链路”统一到了一起。

以前的大模型“聪明”，但不“好使”。而 Gemini 3 的转折来自：

用户界面更直觉

任务拆解更稳定

模型更能理解人类意图

产品团队从训练阶段就介入模型设计

真实用户使用数据可以直接反哺训练

换句话说，Google 终于开始像一家做产品的公司在做大模型。这是 Gemini 3 变化最直观的原因，也是中国用户最先体会到的原因。

三、Benchmark 正在失效，但真实世界永远不会

外界批评 Google 的 benchmark 成绩起伏不定，但 Koray 的解释很罕见地触及本质：主流 benchmark 正在靠近它们的自然上限。GPQA、ARC-AGI 等“智商题”已经被模型顶住，HLE 这种曾经难得离谱的测评如今也能“持续提升”。

Benchmark 会枯竭，但真实世界不会。学生写作、科学研究、专业翻译、复杂跨语境对话、跨语言表达……这些场景永远无法被一个固定测试集穷尽。Google 把模型的最终价值从“得分”转向“能不能帮人完成任务”。这是 Gemini 的第一性原理转变。

四、Gemini 3 的核心不是智力提升，而是让模型“能干活”

从 Gemini 3 开始，Google 清晰确立了三个优先级最高的能力方向。

第一是指令遵从。模型要能“无二义性地理解和执行用户的真实意图”。这对用户体验影响巨大，比提升推理指标更重要。

第二是国际化能力。Google 的用户覆盖超过 200 个国家，“理解全球不同文化语境”成为模型能力的底层指标，而不是翻译能力的延伸。

第三是工具调用与代码执行。这是未来智能体的基础，模型必须不仅能理解问题，还能执行任务、运行工具链、处理工程环境中的真实任务。

三者加在一起，构成了 Google 的 “Gemini 设计哲学”：智能不是来自“更聪明的对话”，而来自“更可靠的执行”。

五、为什么多模态强的 Google，起初 Agent 却不好用？

这是主持人问得最尖锐的问题，也是外界最想知道的矛盾。Koray 的答案意外朴素：研究员可以在实验室推动视觉理解，但 Agent 的任务不是研究员能想出来的，是用户逼出来的。

真正的 Agent 场景来自：

创作者的任务链路

学生的写作流程

工程师的工具调用模式

商业用户的复杂需求

也就是说，Google 走了一条与 OpenAI 不同的路径：不是“demo 优先”，而是“真实用户需求优先”。Agent 的能力不是靠酷炫演示驱动的，而是靠“让百万用户每天用”驱动的。

六、Google 真正的反超武器：模型、产品、工程第一次被统一

Koray 多次强调一个过去被低估的事实：Gemini 3 不是“模型团队”的胜利，而是“工程、产品、模型、安全”第一次从第一天就被捏在一起推进。

以往是：

模型训练完了，产品团队接盘

安全团队在最后做审核

工程团队负责部署

而今天是：

产品团队从训练最初就参与

安全成为训练目标，而不是后置规则

真实用户数据（AI Studio、AI Overviews、Anti-Gravity）直接反哺模型

使用成本、延迟、推理路径都在训练阶段就被优化

Google 终于构建出了一个“模型 × 产品 × 工程”的统一体系。这是它在 2024–2025 年真正反超的结构性基础。

七、Nano Banana Pro 的突破不是“画图变好看”，而是“理解世界结构”

外界关注图像模型总是看“清晰度”、“风格”，但 Koray 在访谈中反复强调，真正的突破来自：

理解 PDF、表格、图表等复杂文档结构

具备结构化的视觉推理

第一次能生成“概念一致的信息图”

一句值得记下的话是：

“当一个模型能把复杂概念准确地用一张信息图表达出来，你就能感受到真正的理解。”

这是多模态模型的真正价值，也直接指向 Agent 的未来能力。

八、多模态不是功能加法，而是真正的“世界模型”入口

Koray 给出了一个简洁但极具说服力的框架：

文本是线性的，视觉是空间的，音频是时序的。真实世界不是只靠线性序列能描述的。因此一个真正智能的模型必须同时具备三种感知维度。

这也是为什么 Google 在推进统一多模态模型上比任何公司都更加坚持——不是因为多模态“更炫酷”，而是因为它是理解世界的基础。

九、统一模型并不是“把视觉塞进语言模型”，而是一场架构革命

外界经常把“统一模型”理解成方向正确的趋势，但 Koray 的解释更具技术深度。他指出：文本和图像的输出结构根本不同——文本是一维的，图像是二维的。这意味着训练方式、损失函数、优化器、token 化方式都要重新发明。

统一模型不是“时代潮流”这么简单，而是必须突破的工程极限。Google 的叙事没有浪漫，也没有玄学，只有工程难题。

十、DeepMind 的文化基因：谦逊、科学与大规模协作

这部分是整场访谈里最“人味”的地方。

DeepMind 的文化由三部分组成：

科学心态 —— 所有问题回到实验与学习，而不是路径依赖。谦逊 —— 那句“我们不知道终极配方”不是客套，而是策略。协作能力 —— 从 25 个人写论文到 2500 人一起推进单一模型。

在一个公司试图从科研转型为工程、从工程转型为产品的过程中，这种文化结构变得至关重要。

十一、规模是 Google 的最大难题，也是最大武器

Koray 承认：规模越大，一致性越难。但规模本身就是推进力。

Google 能够同时推进统一模型、多产品落地、跨部门协作、全球化数据管线、超大规模训练与部署，是因为它拥有世界上最成熟的基础设施链路。

过去两年，这条链路从“沉睡”变回“主力”，重启了 Google 的攻势。

十二、安全不是限制能力，而是训练能力

Google 与 OpenAI 在安全策略上最大的差异不是严格程度，而是方式：安全不是“训练后加过滤器”，而是“训练中学会安全”。

这是“让模型可靠”的关键，并且天然适配 Google 的基础设施规模。

十三、统一模型与专用模型不是路线争夺，而是成本优化

Koray 说得很实在：这不是意识形态问题，而是效率问题。未来一定会同时存在统一模型与专用模型，Google 的策略是用合适的工具做合适的任务，而不是坚持单一范式。

这种务实，是 Google 过去缺失、现在重新找到的品质。

十四、Google 的真正底气：基础设施的重新激活

“我们能成功，不是因为我们更聪明，而是因为基础设施足够强。”Koray 的这句话其实深刻揭示了大模型时代的一个底层事实——智能规模化不是靠天才，而是靠管线。

能训练、能部署、能迭代、能处理全球数据、能保持安全一致性的，是基础设施，而不是算法。

十五、Google 不相信有单一路径，也不相信“持续扩参”能走到终点

他说：

“我们不知道最终配方。”

这句话的潜台词是：

扩参不是终局

统一模型不是最终答案

多模态不是最后形态

未来模型的路线还远未定型

这种“带着不确定性继续前行”的姿态，反而比某些公司宣称的“xxx 是通往 AGI 的唯一路径”更具有长寿感。

十六、下一阶段的重点：推理、执行与真正的自主性

Gemini 3 的故事才刚开始。Google 的下一个目标是：

深层推理

多步任务执行

在复杂场景中的鲁棒性

从“会回答”到“会行动”，这是整个行业的共同方向，但 Google 给出了相对清晰的内部路径。

十七、Google 内部的时间结构：研究 × 工程 × 产品的等权分配

Koray 透露，团队的时间分配不是研究优先，而是三者等权。这意味着一个模型从训练到使用的全过程是统一推进的，而不是线性流程。

这是模型“真正可用”的关键原因。

十八、Gemini 是一个全公司规模的“科学工程项目”

访谈的最后，Koray 用“全公司的科学工程任务”来形容 Gemini 的诞生。那更像是一种内部视角的注脚：模型的进步来自结构性调整，而结构性调整本身比模型更难。训练、数据、工程、产品、安全、协作……这些环节重新对齐，才构成了今天的 Gemini。

过去两年，Google 不是在寻找捷径，而是在恢复一个体系应有的速度和一致性。

当这些基础再次稳固起来，一个属于 Google 的节奏也重新出现了。

整理：周华香

点个“爱心”，再走吧

??时事1：世界杯买球语fc3典tv

??11月23日,天津古文化街“换装”迎新春,

　　(十三)深入分析案件情况，做好案情通报。建立和完善案件、案件风险信息合账制度，做好案件、案件风险信息的登记、汇总和统计分析工作。认真分析案发形势，及时总结案发特点，研究案发趋势，提出案防要求，提高案件风险识别、监测、分析能力，定期开展案情通报。

,必赢亚洲官网app下载。

??11月23日,叙利亚：“火药桶”一触即发,

　　“想不到你还活在世间。”

,快3正规app,赢钱的小游戏,威尼斯在线娱乐官网。

??时事2：万博max手机登录版

??11月23日,中塞基建合作创造多个“第一”,

　　四是提升职工整体素质。引导所内职工利用业余时间积极参与培训和业务学习，主动提升岗位工作能力。开展“岗位练兵、技术比武”活动，把每天的生产工作作为一个比试技术水平的平台，在职工中形成比、学、赶、帮、超的良好氛围。同时提高职工的一岗双责意识和优质服务理念，全面实施“员工素质提升工程”。

,优博app官方,乐鱼体育官方平台,银河官方官网网址。

??11月23日,互联互通习近平推动共建“一带一路”高质量发展,　　不过前不久，一些短视频平台上“大凉山孩子学习条件差”的短视频内容被陆续打假后，小武改变了对大凉山的初印象——在打假视频中，当地学校老师指责某些博主“恶意编造”“捏造苦难”的行为。这也让小武开始深度质疑此前那些研学机构宣传海报上的“卖惨”内容，“我还从多名支教老师社交账号看到了大凉山的真实一面，既有新建的乡村小学，还有教室里的新课桌、白板、投影……”,菲律宾亚星官方网站,贝博bb平台体育艾弗森,澳门皇冠最新登录网站入口。

??时事3：世界杯买球上亚博

??11月23日,第一观察 | 纪念邓小平同志，习近平总书记这样强调,

　　三要充分认识农村工作面临的新形势和新任务，切实增强当好村干部的信心和决心。当前，中原经济区建设、汝州市省直管，给我们带来了机遇和挑战。从国家到地方，对做好“三农”工作、新型农村社区建设都高度关注，非常重视。国家连续出台了一系列强农惠农政策，上级部门也相继出台了粮食直补、农村生态文明建设、危房改造和环境整治等一系列补助政策，可以说，村庄建设和农村工作正面临着非常好的形势和环境。能否抓住机遇、加快发展，是对我们能力的一个考验。我相信，只要我们能够紧紧抓住这一有利时机，创新思路、加压苦干，聚精会神搞建设，一心一意谋发展，一定会大有可为、大有作为，成就一番新事业，创出一片新天地。

,188bet官方下载,天博客户端,bb贝博平台。

??11月23日,海外侨胞和港澳人士参访新疆国际大巴扎等地,

　　鲲鹏俯冲，从那九天之外落下，一头扎进汪洋中，再次化成一条大鱼，名为鲲，搅起无边的浪涛，席卷苍穹。

,ag娱乐亚美平台app,博天堂官网,多宝鱼体育官网。

??时事4：ag国际厅真人

??11月23日,中央宣讲团在各地宣讲党的二十届三中全会精神,

　　小石昊有了目标后，绕过石村，进入灌木丛，从另一边去堵独角兽，一群孩子都睁大了眼睛，屏住呼吸，静心观看。

,彩票官网版下载,葡京体育怎么开户,pg电子游戏模拟器苹果。

??11月23日,中国首部房车文化电影《往后余生》在新疆和田开机,

　　这种恐怖手段让人寒毛倒竖，一个人而已，对抗敌对一脉如此多的强者，骇人听闻。

,365博苹果手机下载,小三合皇B,ag国际馆真人。

【【新春纪事】探访四川金堂“灯笼之乡”：浓浓年味四海扬】

【洛阳古墓博物馆上演“乐舞复活记”】

责编：康体健

审核：曾顺喜

责编：泰伦斯-罗斯

新万博体育

Google 首席 AI 架构师：Gemini 逆风翻盘的18个关键