Google 首席 AI 架构师：Gemini 逆风翻盘的18个关键

如果不是亲耳听到，很难想象一家科技巨头会在镜头前承认：“两年半前，我们远远落后了。”在这次访谈里，DeepMind CTO、Google 首席 AI 架构师 Koray Kavukcuoglu 罕见地拆开了过去两年 Google 的真实处境——不是领先、不是规模，而是被时代加速甩在身后、再一点点追上来的过程。

他没有炫耀参数，也没有谈模型的“神迹”，而是把重点放在更底层、更残酷的问题上：一家全球最强的 AI 实验室，如何在巨大的惯性中重新学会创新、学会工程化、学会组织协作、学会把技术真正变成产品？

Gemini 的故事只是表层。真正发生变化的，是 Google 这家公司的骨架与节奏。

原文访谈链接：https://www.youtube.com/watch?v=fXtna7UrL44以下是根据访谈实录整理的关键议题，希望也能帮你更清晰地读懂 Google 的这次“重构”。

一、真正的起点不是突破，而是承认自己落后了

访谈中最刺耳也最重要的一句话，出现在结尾：

“当 Gemini 项目开始时，我们离最先进水平还很远，那是一个追赶。”

这句话标志着一个巨大的认知转折：Google 承认自己在 LLM 起跑线上是真正的落后者。不是“状态不好”这种轻描淡写，而是“远远落后”。这意味着 DeepMind 必须抛弃此前十年建立的自信，从最基础的用户使用场景重新学习。

而这种承认，是一切变化的源头。Koray 在访谈里反复强调：真正的转折不是某个新技术，而是 Google 接受自己必须重新建立训练方式、产品方式、工程方式以及组织方式。

二、为什么中国用户最先明显感觉到 Gemini 变好了？

访谈一开始，主持人提到一个特别中国的反馈：Gemini 3 在中国用户中被形容为“像 Windows XP 一样稳定好使”。Koray 很有兴致地解释，这不是模型本身突然“智商暴涨”，而是 Google 终于把“模型 × UI × 任务链路”统一到了一起。

以前的大模型“聪明”，但不“好使”。而 Gemini 3 的转折来自：

用户界面更直觉

任务拆解更稳定

模型更能理解人类意图

产品团队从训练阶段就介入模型设计

真实用户使用数据可以直接反哺训练

换句话说，Google 终于开始像一家做产品的公司在做大模型。这是 Gemini 3 变化最直观的原因，也是中国用户最先体会到的原因。

三、Benchmark 正在失效，但真实世界永远不会

外界批评 Google 的 benchmark 成绩起伏不定，但 Koray 的解释很罕见地触及本质：主流 benchmark 正在靠近它们的自然上限。GPQA、ARC-AGI 等“智商题”已经被模型顶住，HLE 这种曾经难得离谱的测评如今也能“持续提升”。

Benchmark 会枯竭，但真实世界不会。学生写作、科学研究、专业翻译、复杂跨语境对话、跨语言表达……这些场景永远无法被一个固定测试集穷尽。Google 把模型的最终价值从“得分”转向“能不能帮人完成任务”。这是 Gemini 的第一性原理转变。

四、Gemini 3 的核心不是智力提升，而是让模型“能干活”

从 Gemini 3 开始，Google 清晰确立了三个优先级最高的能力方向。

第一是指令遵从。模型要能“无二义性地理解和执行用户的真实意图”。这对用户体验影响巨大，比提升推理指标更重要。

第二是国际化能力。Google 的用户覆盖超过 200 个国家，“理解全球不同文化语境”成为模型能力的底层指标，而不是翻译能力的延伸。

第三是工具调用与代码执行。这是未来智能体的基础，模型必须不仅能理解问题，还能执行任务、运行工具链、处理工程环境中的真实任务。

三者加在一起，构成了 Google 的 “Gemini 设计哲学”：智能不是来自“更聪明的对话”，而来自“更可靠的执行”。

五、为什么多模态强的 Google，起初 Agent 却不好用？

这是主持人问得最尖锐的问题，也是外界最想知道的矛盾。Koray 的答案意外朴素：研究员可以在实验室推动视觉理解，但 Agent 的任务不是研究员能想出来的，是用户逼出来的。

真正的 Agent 场景来自：

创作者的任务链路

学生的写作流程

工程师的工具调用模式

商业用户的复杂需求

也就是说，Google 走了一条与 OpenAI 不同的路径：不是“demo 优先”，而是“真实用户需求优先”。Agent 的能力不是靠酷炫演示驱动的，而是靠“让百万用户每天用”驱动的。

六、Google 真正的反超武器：模型、产品、工程第一次被统一

Koray 多次强调一个过去被低估的事实：Gemini 3 不是“模型团队”的胜利，而是“工程、产品、模型、安全”第一次从第一天就被捏在一起推进。

以往是：

模型训练完了，产品团队接盘

安全团队在最后做审核

工程团队负责部署

而今天是：

产品团队从训练最初就参与

安全成为训练目标，而不是后置规则

真实用户数据（AI Studio、AI Overviews、Anti-Gravity）直接反哺模型

使用成本、延迟、推理路径都在训练阶段就被优化

Google 终于构建出了一个“模型 × 产品 × 工程”的统一体系。这是它在 2024–2025 年真正反超的结构性基础。

七、Nano Banana Pro 的突破不是“画图变好看”，而是“理解世界结构”

外界关注图像模型总是看“清晰度”、“风格”，但 Koray 在访谈中反复强调，真正的突破来自：

理解 PDF、表格、图表等复杂文档结构

具备结构化的视觉推理

第一次能生成“概念一致的信息图”

一句值得记下的话是：

“当一个模型能把复杂概念准确地用一张信息图表达出来，你就能感受到真正的理解。”

这是多模态模型的真正价值，也直接指向 Agent 的未来能力。

八、多模态不是功能加法，而是真正的“世界模型”入口

Koray 给出了一个简洁但极具说服力的框架：

文本是线性的，视觉是空间的，音频是时序的。真实世界不是只靠线性序列能描述的。因此一个真正智能的模型必须同时具备三种感知维度。

这也是为什么 Google 在推进统一多模态模型上比任何公司都更加坚持——不是因为多模态“更炫酷”，而是因为它是理解世界的基础。

九、统一模型并不是“把视觉塞进语言模型”，而是一场架构革命

外界经常把“统一模型”理解成方向正确的趋势，但 Koray 的解释更具技术深度。他指出：文本和图像的输出结构根本不同——文本是一维的，图像是二维的。这意味着训练方式、损失函数、优化器、token 化方式都要重新发明。

统一模型不是“时代潮流”这么简单，而是必须突破的工程极限。Google 的叙事没有浪漫，也没有玄学，只有工程难题。

十、DeepMind 的文化基因：谦逊、科学与大规模协作

这部分是整场访谈里最“人味”的地方。

DeepMind 的文化由三部分组成：

科学心态 —— 所有问题回到实验与学习，而不是路径依赖。谦逊 —— 那句“我们不知道终极配方”不是客套，而是策略。协作能力 —— 从 25 个人写论文到 2500 人一起推进单一模型。

在一个公司试图从科研转型为工程、从工程转型为产品的过程中，这种文化结构变得至关重要。

十一、规模是 Google 的最大难题，也是最大武器

Koray 承认：规模越大，一致性越难。但规模本身就是推进力。

Google 能够同时推进统一模型、多产品落地、跨部门协作、全球化数据管线、超大规模训练与部署，是因为它拥有世界上最成熟的基础设施链路。

过去两年，这条链路从“沉睡”变回“主力”，重启了 Google 的攻势。

十二、安全不是限制能力，而是训练能力

Google 与 OpenAI 在安全策略上最大的差异不是严格程度，而是方式：安全不是“训练后加过滤器”，而是“训练中学会安全”。

这是“让模型可靠”的关键，并且天然适配 Google 的基础设施规模。

十三、统一模型与专用模型不是路线争夺，而是成本优化

Koray 说得很实在：这不是意识形态问题，而是效率问题。未来一定会同时存在统一模型与专用模型，Google 的策略是用合适的工具做合适的任务，而不是坚持单一范式。

这种务实，是 Google 过去缺失、现在重新找到的品质。

十四、Google 的真正底气：基础设施的重新激活

“我们能成功，不是因为我们更聪明，而是因为基础设施足够强。”Koray 的这句话其实深刻揭示了大模型时代的一个底层事实——智能规模化不是靠天才，而是靠管线。

能训练、能部署、能迭代、能处理全球数据、能保持安全一致性的，是基础设施，而不是算法。

十五、Google 不相信有单一路径，也不相信“持续扩参”能走到终点

他说：

“我们不知道最终配方。”

这句话的潜台词是：

扩参不是终局

统一模型不是最终答案

多模态不是最后形态

未来模型的路线还远未定型

这种“带着不确定性继续前行”的姿态，反而比某些公司宣称的“xxx 是通往 AGI 的唯一路径”更具有长寿感。

十六、下一阶段的重点：推理、执行与真正的自主性

Gemini 3 的故事才刚开始。Google 的下一个目标是：

深层推理

多步任务执行

在复杂场景中的鲁棒性

从“会回答”到“会行动”，这是整个行业的共同方向，但 Google 给出了相对清晰的内部路径。

十七、Google 内部的时间结构：研究 × 工程 × 产品的等权分配

Koray 透露，团队的时间分配不是研究优先，而是三者等权。这意味着一个模型从训练到使用的全过程是统一推进的，而不是线性流程。

这是模型“真正可用”的关键原因。

十八、Gemini 是一个全公司规模的“科学工程项目”

访谈的最后，Koray 用“全公司的科学工程任务”来形容 Gemini 的诞生。那更像是一种内部视角的注脚：模型的进步来自结构性调整，而结构性调整本身比模型更难。训练、数据、工程、产品、安全、协作……这些环节重新对齐，才构成了今天的 Gemini。

过去两年，Google 不是在寻找捷径，而是在恢复一个体系应有的速度和一致性。

当这些基础再次稳固起来，一个属于 Google 的节奏也重新出现了。

整理：周华香

点个“爱心”，再走吧

《亚星平台登录网站》，《Q8X2R7L1T4J5M9B6W3》

新利体育官方网站

“赌神牛报”

生财有道特码报

……

11月27日

“果博平台首页”如何评价WBG新赛季阵容

↓↓↓

哈里斯确认竞选搭档，是林昀儒3比2张本智和

11月27日，山西安泽发生山火 600多人正在全力扑救，优博app下载，AG官方网址，m6米乐快速开户，申博真人在线app下载

11月27日，重庆新贯通一连续刚构桥最高墩柱达192米，新皇冠官网，世界杯投注金额，永利体育在线注册，bwin官方

11月27日，短道速滑世巡赛首站：中国队选手林孝埈男子500米摘铜，龙舞gippro，360足球直播，十大正规赌场娱乐场，b0b体育平台下载

11月27日，防止有害文具损害学生健康，千亿官网最新版，澳门世界杯下注平台，九五至尊快速开户，易发游戏官网

11月27日，河北青龙：燕山腹地喜获致富“药”方，买球用哪个app，u发国际，亚洲bet356的网址，新锦江体育

11月27日，截至今日12时新疆已记录到56次3级及以上余震，必威手机登陆，球探体育比分，ManBetX万博最新版APP，世界杯买球as83*me认准

11月27日，11月中国物流业景气指数为52.8% 需求回升总体向好，AG真人在线试玩，0706澳门威斯人手机app下载，九五至尊体育外围，英亚体育平台

11月27日，最高人民法院发布仲裁司法审查典型案例，天美棋牌平台，申博在线登陆，365平台下载app，ag捕鱼登陆

监制：邓金木

策划：赖晗

主创：唐征宇林箴贺陈佛烘颜亦阳陈林韵

编辑：王家菁、段圣祺

新万博体育

下载APP

全部

Google 首席 AI 架构师：Gemini 逆风翻盘的18个关键

热门视频