跳转至

Ep127 Sg90Aehv3Vu

LaTeX 源码 · 备用 PDF · 观看视频

导读:为什么这期要当作一份季度讲义来读

本期是“全球大模型季报”的跨年对谈。它不是普通人物访谈,而是一次面向 2026 年的 AI 产业、模型范式和投资主线复盘。张小珺负责把问题推进到商业、平台和创业层面,广密则把一组季度观察压缩成几个关键词:AI War、交替领先、基础模型像综合电商、OpenAI 与 Google 的双主线、Pre-training/RL/Online Learning 三种范式,以及“模型即产品,数据即模型”。

因此,本讲义不按原始字幕逐句展开,而按教学逻辑重组为六条主线。第一条是为什么“AI Bubble”不足以解释这一轮投入,AI 更像输不起的军备竞赛;第二条是 OpenAI 的收入账与 Google/OpenAI 的入口之争;第三条是 GPT、Claude、Gemini 的交替领先与基础模型公司的平台类比;第四条是第三范式 Online Learning;第五条是数据、Agentic Web、Neo Labs 与 Robotics;第六条是中美叙事、华人创业者和未来三到五年的长期变量。

本期核心命题

广密的中心判断不是“没有泡沫”,而是“泡沫框架太窄”。AI 的投入同时被商业防守、国家战略、算力供给、人才竞争和下一范式预期驱动。它更像 AI War:没人确定短期账一定算得过来,但关键玩家都不敢下牌桌。

视觉策略说明

本视频没有 slides、白板、论文画面或产品演示。按照播客工作流,正文只使用封面做来源识别,不重复插入固定访谈画面;正文中的图均为自制概念图,用来承载结构关系,细节解释放在文字、表格和读图框里。

本章小结

EP127 的价值在于把过去几期反复出现的模型、数据、Agent、算力和创业话题压缩成一个跨年判断:2026 年要看的不是单个 benchmark,而是范式是否变化、入口如何重分配、谁能把数据和产品做成闭环。

从 AI Bubble 到 AI War:为什么“泡沫”不是充分解释

本节先处理全片的总框架。节目开头问的是“AI Bubble”,广密给出的回答却是“更像 AI War”。这不是文字游戏,而是分析单位的变化。如果只把 AI 当成商业项目,就会从现金流、估值和资本开支出发,问“这笔钱怎样赚回来”;如果把 AI 当成下一代平台、国防能力和科技秩序重组,就还要问“如果不投,会不会被颠覆”。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{ai-war-alliances.png}
\caption{AI War 的两条主线:Nvidia GPU 生态、Google TPU 生态,以及围绕 OpenAI/Google 形成的反制联盟。自制概念图,依据 00:15:04--00:17:48 对谈内容整理。}
\end{figure}

读图:这张图先看生态,再看联盟

左上和中上分别是 Nvidia GPU 与 Google TPU 两条硬件生态主线。OpenAI、Anthropic 等领先模型公司更多站在 GPU 生态中;Google 则在模型、芯片、云和产品端到端整合。下方的“反 Google 联盟”和“反 OpenAI 联盟”提醒我们:越强的单一玩家,越会触发其他巨头、资本和生态伙伴的制衡。

AI War 的第一层含义:商业防守

前面说 AI War 不是修辞,本节先看商业层面的输不起。广密举了两个现实例子。第一个是云厂商被模型白牌化:过去开发者和企业优先考虑 AWS、Azure 或 Google Cloud,现在很多新应用先问“用哪个模型”:GPT、Claude 还是 Gemini。云仍然重要,但用户心智可能从云迁移到模型。

第二个是 Agent 可能成为新流量入口。传统搜索、Super App、OTA、出行、招聘和电商平台,许多商业模式都建立在信息分发、匹配和交易抽成上。如果 Agent 能替用户比较、谈判、下单、支付和跟踪,平台的抽成和入口权就会被重新定价。对巨头来说,这不是“多一个工具”,而是已有利润池的防守战。

误读警告:AI War 不等于短期账一定成立

说 AI 是战争,不代表每个数据中心项目、每个模型训练计划和每家创业公司都值得投资。它只说明关键玩家的行为不能用普通 SaaS 投资回报周期解释,因为“不投入”的机会成本可能是平台地位被重写。

AI War 的第二层含义:国家战略和算力动员

广密进一步把 AI 比作新的国防和核武器。这句话容易被听成夸张,但它指向的是国家层面的能力结构:谁掌握更强模型、更多算力、更密集研究员、更完整芯片供应链,谁就可能在软件生产、科学发现、军事辅助、产业自动化和信息分发上获得系统性优势。

这也是为什么短期现金流算不过来的项目仍会获得资本和政策支持。商业公司担心被颠覆,国家担心战略落后,资本市场又在寻找少数能吸纳巨大资金并仍有上行想象的方向。三者叠加后,AI 资本开支的节奏就很难只用“泡沫”二字解释。

分析 AI 投入的三层账

账本 关心的问题 对应本期判断
财务账 收入、毛利、现金流、折旧如何覆盖投入 OpenAI 的 1.4T 承诺短期会被质疑。
平台账 新入口会不会替代旧入口,谁掌握用户关系 Agent 与模型云可能重写搜索、云和 Super App。
战略账 如果不投入,国家和公司是否失去未来能力 AI 被类比为国防和核武器,玩家不敢轻易离场。

从泡沫争论转向格局分析

泡沫争论常常问“估值是不是太高”。本期更值得保留的问题是“谁会被迫继续投入、谁能形成联盟、谁能让投入变成产品和数据闭环”。这也是后文的展开顺序:先拆 OpenAI 的收入账,再看 Nvidia/Google 阵营,然后讨论三大模型为什么交替领先,最后进入 Online Learning 这个可能改变现有格局的变量。

本章小结

AI War 框架把讨论从估值情绪拉回结构变量。它不否认局部泡沫,却提醒读者:当 AI 同时威胁云、搜索、Super App、白领劳动和国家竞争力时,巨头和国家会用比普通商业项目更激进的方式投入。

OpenAI 收入账:看得见的收入与看不见的潜在收入

上一章解释了为什么巨头不容易下牌桌,本章把镜头收回到 OpenAI。围绕 OpenAI 最大的争议,是巨额算力承诺与未来现金流是否匹配。广密的拆法很有教学意义:先分“看得见的收入”,再分“看不见的收入”。前者像互联网平台和云服务,后者则取决于 Agent 能否替代劳动、AI 能否做出人类做不了的高价值任务。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.92\textwidth]{openai-revenue-stack.png}
\caption{OpenAI 收入栈:订阅、广告电商、API、Agent 劳动与 AI 科学家。自制概念图,依据 00:07:38--00:13:10 与 00:13:32--00:15:04 对谈内容整理。}
\end{figure}

读图:从“互联网平台收入”看到“劳动预算”

前三层是相对看得见的收入:订阅、广告电商和 API。后两层更难估计:Agent 如果能端到端替代白领工作,就吃到工资预算;AI 如果能写 CUDA、做科学发现或寻找新材料,就创造现在没有被人类充分完成的增量价值。

看得见的收入:订阅、广告电商和 API

广密的第一类收入是订阅。可用一个简化公式表示:

\[ R_{\text{sub}} = U \times p \times a \]

其中,\(R_{\text{sub}}\) 表示订阅年收入;\(U\) 表示月活或可触达用户规模;\(p\) 表示付费率;\(a\) 表示单个付费用户的年均收入。节目中给出的乐观估计是:如果 ChatGPT 做到数十亿级活跃用户,且 10% 左右用户付费,订阅收入可以进入数百亿美元量级。这一类推来自 Office、Netflix 等成熟订阅产品。

第二类收入是广告和电商。逻辑是:大流量、高频、有粘性的入口最终会变现。短视频和手机广告早期也被质疑过屏幕小、场景不适合,但后来证明用户注意力在哪里,广告和交易就会迁移到哪里。ChatGPT 如果融合搜索、推荐、购物和服务撮合,就可能从传统搜索广告和平台抽成中拿走一部分。

第三类收入是 API,也就是“模型云”。广密把它类比为 Amazon 从电商中生长出 AWS:当公司自身需要巨大计算、数据和工程系统时,这套能力也可以对外服务开发者。对 OpenAI 来说,模型能力越强、成本越低、开发者生态越大,API 收入就越像新的云业务。

看得见收入的共同前提

订阅、广告电商和 API 都依赖同一件事:ChatGPT 必须保持大流量、高频使用、强品牌和足够好的模型体验。如果用户入口迁移到 Gemini、手机厂商或垂直 Agent,这三类收入的上限都会被压低。

看不见的收入:Agent 替代劳动

更大的想象来自劳动预算。工具软件卖的是效率,Agent 如果真正端到端完成任务,卖的就可能是“替代一部分工资”。软件开发是最早出现这种信号的行业:AI Coding 在一年内长出百亿美元级别市场,说明知识工作中确实存在可被模型迅速吸收的任务。

但这里有两个关键门槛。第一,Agent 必须可靠到能够承担责任,不只是生成建议;第二,企业必须愿意把预算从人力、外包或传统软件迁移到 AI 系统。只有越过这两个门槛,AI 才不只是“帮员工更快”,而是成为新的劳动供给。

工具预算与工资预算不是一回事

一个员工愿意每月为工具付几十美元,不等于公司愿意把一个岗位预算交给 Agent。后者要求稳定性、权限控制、审计、责任归属和可预期结果。很多 AI 公司会卡在“很好用的工具”,而不是“能吃工资预算的系统”。

更远的收入:AI 做人做不了的事

广密还提到另一类看不见收入:AI 可能完成现在人类做不了或做得很慢的高价值任务,例如重写 CUDA、发现新材料、加速医学研究、寻找室温超导线索,甚至“AI 做 AI 科学家”。这类收入不能简单归入存量替代,因为它可能创造新问题、新市场和新科学路径。

这里的前提更强:模型不仅要会调用现有知识,还要在长期实验、反馈、推理、记忆和自主学习中改进。这就自然引出后文的 Online Learning。换句话说,OpenAI 的长期收入想象越大,对模型可靠性、持续学习和真实环境反馈的要求越高。

本章小结

OpenAI 收入账可以分成三层:订阅、广告电商和 API 是看得见的平台收入;Agent 替代白领劳动是更大的存量迁移;AI 做科学发现和高价值增量任务,则依赖更根本的模型能力突破。短期质疑来自财务账,长期乐观来自平台账和范式账。

两大阵营与三大模型:交替领先为什么会成为常态

前两章讨论投入和收入,本章进入竞争格局。这里的问题是:如果大家都继续投钱,产业会围绕哪些主线组织起来?广密把 AI War 的硬件生态简化成两条主线:Nvidia GPU 生态和 Google TPU 生态;把应用/模型层主线简化成 OpenAI、Anthropic、Google Gemini 的三强交替领先。这个简化很有用,因为它避免把每个季度的新榜单都当成终局,也提醒我们把“谁短期领先”放回更长期的生态竞争中理解。

Nvidia GPU vs Google TPU

本节先从底层硬件生态讲起,因为模型公司的能力、成本和迭代速度都要落在芯片、软件栈和云供给上。理解 GPU 与 TPU 的差异,才能理解为什么同样是模型竞争,Google 和 Nvidia 代表的是两种完全不同的产业组织方式。

TPU 是 Google 自研的 Tensor Processing Unit,面向机器学习训练和推理优化;GPU 是 Nvidia 主导的通用并行计算生态,围绕 CUDA、开发者、云服务、服务器、网络和供应链形成了强大网络效应。Google 的优势是端到端:模型、芯片、云、搜索、Android、YouTube 和 Workspace 都在一个公司内;Nvidia 的优势是开放生态:OpenAI、Anthropic、xAI、Meta、云厂商和创业公司都可以围绕 GPU 形成外部创新网络。

广密把 Google 比作 AI 时代的苹果,把 Nvidia 比作 AI 时代的安卓。这不是说二者完全等价,而是指出两种组织方式:垂直整合与开放生态。前者在产品和成本上可能形成闭环,后者在开发者、多公司创新和供给扩张上更有弹性。

术语消化:GPU、TPU 与 CUDA

术语 解决的问题 本期关系
GPU 用大规模并行计算加速矩阵运算和深度学习 Nvidia 生态的核心,支撑 OpenAI/Anthropic 等外部模型公司。
TPU Google 为机器学习定制的加速芯片 支撑 Google 从芯片到 Gemini 的垂直闭环。
CUDA Nvidia 的并行计算软件生态 让 GPU 不只是硬件,而是开发者和工程工具链。
生态位 公司在产业链里的稳定位置 Google 做全栈,Nvidia 做底层生态,模型公司做能力和产品。

GPT、Claude、Gemini 的交替领先

三大模型的交替领先,是本期最重要的格局判断之一。广密认为,在现有 Pre-training 加 RL/Post-training 范式下,顶尖团队的方法、人才和信息流动很快,单家公司很难长期拉开巨大差距。于是竞争从“谁一次性碾压”变成“谁在某个战略 Beta 上端到端优化得更彻底”。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{top-model-rotation.png}
\caption{三大模型交替领先:GPT、Claude、Gemini 的战略重点不同。自制概念图,依据 00:17:48--00:25:40 对谈内容整理。}
\end{figure}

读图:交替领先不是没有分化

GPT 更强在 C 端产品、品牌和个人助理心智;Claude 更强在 Coding、企业和知识工作者体验;Gemini 更强在多模态、Google 生态和 Android/搜索分发。交替领先说明通用能力难以长期拉开,但分化说明每家公司会围绕自己的数据和产品目标优化。

Benchmark SOTA 的误读

SOTA 原意是 state of the art,即当前最先进水平。但本期强调:榜单 SOTA 不等于商业 SOTA。真正重要的指标可能是营收、客户、日活、留存、tokens 输出、任务成功率和用户愿意交付多少真实工作。

基础模型公司为什么像综合电商

广密提出一个“偷懒但有用”的类比:基础模型公司像十年前的综合电商,Scale SKU 类比 Scale Data。综合电商从书扩展到全品类时,可以复用仓储、物流、支付、流量和用户关系;基础模型公司从聊天扩展到 Coding、Office、投研、医疗、设计和多模态时,也可以复用模型架构、数据管线、评测系统、RL 流程和用户入口。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.94\textwidth]{foundation-model-as-ecommerce.png}
\caption{基础模型 = 综合电商:Scale SKU 类比 Scale Data。自制概念图,依据 00:25:40--00:27:40 对谈内容整理。}
\end{figure}

读图:类比的重点是“复用基础设施”

综合电商能从图书扩到全品类,不只是因为想卖更多东西,而是仓配、支付、推荐和用户信任可以复用。基础模型公司能从聊天扩到 Coding、Office 和行业 Agent,也不是简单加功能,而是数据采集、训练、评测和产品反馈管线可以复用。

这个类比对创业者有两个提醒。第一,垂直场景不一定没有价值,但要知道自己是在做“垂直电商”还是在做“小红书”。垂直电商可能赚钱,但平台上限受限;小红书在综合电商之外构建内容资产和社区心智,才有不同价值。第二,模型公司向下做数据的效率更高,创业公司必须找到基础模型公司不容易获得的差异化数据、工作流或用户关系。

本章小结

本章把竞争格局拆成硬件生态、模型三强和平台类比。交替领先说明现有范式下技术差距难以永久拉开;战略 Beta 和数据闭环则决定每家公司在哪里建立特色。基础模型像综合电商,意味着“横向扩品类”的能力很强,创业公司必须避开被轻易 Scale Data 的位置。

上一章说明 Google 和 OpenAI 都在核心牌桌上,本章专门讨论两者的入口竞争。节目中最有张力的判断是:Google 王者归来不等于危机解除,ChatGPT 也不只是一个边缘聊天工具。二者最终可能在搜索、个人助理、移动端和广告预算上直接相遇。

Gemini 崛起后,OpenAI 为什么仍然强

广密对 OpenAI 的看法偏乐观,原因有三。第一,OpenAI 可能是过去二十年里少数真正有机会挑战 Google 的公司。微软 Bing 也没有从根本上改变搜索入口,但 ChatGPT 把用户心智从“搜索答案”迁移到“让 AI 帮我理解、生成、执行”。第二,OpenAI 仍是最好的 AI 标的之一:人才密度、产品感、品牌和用户规模都很强。第三,OpenAI 仍有较高概率参与下一范式探索,这对长期估值很关键。

Google 的优势同样真实:Gemini、多模态、Android、Search、YouTube、Workspace、Cloud、TPU、Waymo 等资产形成了很厚的底盘。问题在于,Google 的强并不自动消灭 OpenAI;这可能是一个双巨头甚至多巨头长期并存的市场。

Search 会怎样被 Agent 重写

前面说 Google 的危机没有真正解除,问题就落到 Search 上:搜索不是一个单独功能,而是广告、网页分发、商家流量和用户决策的总入口。本节把传统搜索流程和 Agent 流程并排看,才能看出流量重分配为什么会触及 Google 的利润核心。

搜索的传统流程是:用户输入关键词,搜索引擎返回链接、摘要和广告,用户再点击、比较、购买或继续搜索。Agent 流程则可能是:用户给目标,Agent 搜索、比较、调用工具、议价、下单、支付、跟踪,最后返回结果。两者差异不只是界面,而是价值链位置。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{search-agent-disruption.png}
\caption{Search 与 Agent 的流量重分配:从搜索链接到任务完成。自制概念图,依据 00:31:20--00:35:08 与 00:50:57--00:52:53 对谈内容整理。}
\end{figure}

读图:Agent 抢的是分配权

图中用户目标先进入 Agent,而不是直接进入搜索框或 Super App。Agent 再决定调用搜索、票务、出行、支付或企业系统。谁控制这个入口,谁就有机会重新分配广告、交易、抽成和用户数据。

Agent 不会瞬间消灭搜索

Agent 要真正改写搜索广告,必须解决引用可信度、实时信息、支付、权限、商家接入、反作弊、审计和责任归属。短期更可能是混合形态:传统搜索融合 AI,ChatGPT 融合搜索,二者互相侵蚀。

ChatGPT 的移动端心智与 Gemini 的生态心智

接下来需要从入口机制转到用户心智,因为同样能回答问题的模型,最终可能在完全不同的时间、设备和场景里被打开。本节讨论的是使用频率和生活位置,而不只是模型能力。

节目中提到一个非常产品化的观察:ChatGPT 更像生活助理,很多用户会在周末、移动端和日常生活中使用;Gemini 在一些场景中更像工作时间的生产力工具,且依托 Android 和新兴市场有天然分发优势。这个差异意味着,模型能力之外,使用频率、场景温度和用户心智同样重要。

如果 ChatGPT 能成为 10--20 亿日活级别的个人助理,它的商业化根基会非常稳;如果 Gemini 能把 Android、Search、Workspace 和多模态真正串起来,Google 也可能在 AI 时代继续保持强势。两条路径不是互斥,而是在争夺用户最先打开哪个入口。

本章小结

Google 的危机从“会不会错过 AI”变成“能不能在 Agent 入口里继续掌握分配权”。OpenAI 的挑战从“能不能做出好模型”变成“能不能把 ChatGPT 扩展成高频、可靠、可变现的个人助理和搜索/执行入口”。这一章的结论是:入口战争刚开始,模型榜单只是其中一小部分。

第三范式 Online Learning:为什么它可能比机器人、世界模型、多模态更根本

前面讨论的是现有竞争格局,本章进入技术范式。广密认为 Pre-training scaling 快结束了,RL/Post-training 仍有空间,但下一阶段真正可能改变格局的是 Online Learning 或 Continuous Learning。这里的核心不是“模型有更长上下文”这么简单,而是模型能否从交互、反馈和真实任务中持续学习。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{scaling-paradigm-shift.png}
\caption{三种学习范式:Pre-training、RL/Post-training、Memory 与 Online Learning。自制概念图,依据 00:36:01--00:41:01 对谈内容整理。}
\end{figure}

读图:从静态压缩走向交互学习

Pre-training 像一次性压缩大规模互联网和专业数据;RL/Post-training 用人类反馈、专家过程和任务结果塑形;Memory 和长上下文让模型记住更多用户与任务历史;Online Learning 进一步要求模型在推理和交互过程中真正更新自己,越用越懂用户、越做越会做。

Pre-training:巨大的压缩器

Pre-training,即预训练,是用海量文本、代码、多模态数据训练模型,让它学会预测下一个 token 或下一段结构。广密强调,今天的模型仍然像巨大的压缩器:数据分布里没有的任务往往不 work,只有压缩过类似数据,模型才更可靠。

这句话很关键。它解释了为什么模型在知识层面已经超过多数人,却在真实工作流里仍会失败。因为真实工作不是只回答问题,而是要进入 CRM、财务系统、设计软件、医院流程、销售现场、企业权限和具体工具链。模型如果没有见过足够多真实过程,就只能靠泛化猜测。

压缩器视角

模型不是凭空“懂”任务,而是把训练数据中的模式压缩成参数和表示。一个任务如果长期没有进入数据分布,模型就很难稳定完成;要让 Agent 可靠,必须把真实工作过程变成可学习的数据。

RL/Post-training:专家数据与任务反馈

前面把预训练解释为大规模压缩,本节进一步看“压缩之后怎样塑形”。如果说 Pre-training 让模型学到世界上已经存在的大量模式,那么 RL/Post-training 更关心模型怎样在具体任务、用户偏好和专家过程里变得可用。

RL 是 Reinforcement Learning,强化学习。它不只是“奖励模型”四个字,而是一套让系统根据结果反馈调整行为的训练方式。在大模型语境下,Post-training 通常包括指令微调、人类偏好反馈、专家轨迹、自动评测、工具使用反馈和任务结果评分。节目中把这类数据比作“新能源”:有用,但总量较少,采集成本高。

如果 Coding Agent 要变强,需要高质量代码、真实 issue、测试、PR 反馈和长期软件工程过程;如果医疗 Agent 要变强,需要医生诊断过程、病例、检查、用药、随访和责任边界;如果投研 Agent 要变强,需要分析师工作流、数据来源、模型假设和错误复盘。每一类都不是普通网页文本,而是专家过程数据。

术语消化:RL/Post-training 相关词

术语 核心机制 本期作用
RL 用奖励或结果反馈优化策略 让模型不只模仿文本,还能朝任务成功优化。
Post-training 预训练后的对齐、指令、偏好和任务训练 决定模型是否符合产品目标。
专家轨迹 金牌专家完成任务的过程记录 让模型学习真实工作流,而不只是答案。
Credit assignment 把成功或失败归因到中间步骤 Robotics 章节中用来解释每一步是否有利于任务成功。
Value function 估计当前状态或动作未来价值的函数 帮助系统知道哪些步骤更接近成功。

Online Learning:边交互边学习

Online Learning 在本期中指模型自主学习、持续学习、从交互中吸收用户和任务经验。与静态预训练不同,它要求模型在使用过程中变得更懂用户、更懂任务、更主动。广密举的产品图景是:今天 ChatGPT 必须等用户 prompt;未来 AI 可能在后台反思、准备、联想,下一次用户提问时已经有了更深的理解。

这个能力一旦成立,会改变产品形态。AI 不再是每次从零推理的工具,而是和用户共同成长的长期伙伴;不再只是回答当前问题,而是记住用户目标、偏好、项目、上下文和历史错误;不再只是被动等命令,而是主动准备和提醒。

Online Learning 的定义

在本讲义中,Online Learning 指模型或 AI 系统能从持续交互、任务结果和用户反馈中学习,并把学习结果稳定用于未来行为。它不是简单保存聊天记录,而是把经验转化为能力、偏好或策略更新。

Memory 不等于 Online Learning

Memory 可以只是存储用户信息;长上下文可以只是把更多历史塞进 prompt。Online Learning 要求系统从这些历史里学到可泛化的行为改进。只会“记住事实”不等于会“越用越聪明”。

能源隐喻:石油、新能源与核聚变

本节用能源隐喻把前三个学习阶段压缩成一个容易记住的比较框架。这个隐喻的价值不在于精确预测技术路线,而在于帮助读者同时看到存量数据、专家数据和持续学习三类资源的约束差异。

广密用三个能源隐喻解释范式差异:Pre-training 数据像石油,量大但有限;RL 专家数据像新能源,有用但总量少;Online Learning 像核聚变,还没有真正突破,但如果突破,能量密度和上限会完全不同。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{energy-metaphor.png}
\caption{能源隐喻:石油、新能源和核聚变对应三类数据与学习方式。自制概念图,依据 00:41:01--00:43:05 对谈内容整理。}
\end{figure}

读图:隐喻的边界

石油强调存量数据有限,新能源强调专家数据有用但采集困难,核聚变强调 Online Learning 的潜在上限。隐喻不说明技术一定会按能源史重演;它只是帮助我们区分三类数据和学习机制的约束。

为什么说机器人、世界模型和多模态可能是“假问题”

节目中最容易引发争议的一句话是:机器人、世界模型、多模态很多可能是假问题,Online Learning 才是真问题。这里的“假问题”不是说这些方向不重要,而是说它们可能依赖更底层的泛化和持续学习。如果没有泛化,机器人就会像自动驾驶一样:每个长尾场景都要采数据、标数据、调规则,长期陷入“有多少人工就有多少智能”。

多模态和世界模型也类似。模型能看视频、生成图像、预测物理过程,不等于它能从真实环境中持续学习、迁移经验、处理新任务。真正难的是把经验变成可复用能力。Online Learning 如果突破,机器人、世界模型和多模态都可能获得更强泛化;如果不突破,这些方向就会继续被数据量、标注成本和真实环境复杂度拖住。

本章小结

第三范式的核心不是一个新名词,而是从静态压缩走向持续交互学习。Pre-training 解决大规模知识压缩,RL/Post-training 解决任务反馈和专家过程,Online Learning 则试图解决“越用越聪明”和“从真实环境中泛化”的问题。它之所以重要,是因为它可能改变现有三强交替领先的平衡。

模型即产品,数据即模型:Agentic Web 与投资主线

上一章说 Online Learning 需要真实交互和反馈,本章把这个判断落到产品、数据和投资策略。广密反复强调“模型即产品,数据即模型”。这句话看似绕口,其实非常具体:过去几年最大的体验升级来自模型升级,而模型升级的根部又来自数据分布升级。谁能拿到差异化数据,谁就能在模型和产品上形成差异。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{model-data-product-loop.png}
\caption{模型即产品,数据即模型:用户任务、交互数据、专家蒸馏、模型升级和产品体验构成闭环。自制概念图,依据 00:43:05--00:56:45 对谈内容整理。}
\end{figure}

读图:产品体验回到数据分布

用户任务暴露真实工作流,交互数据记录偏好和失败点,专家蒸馏补足高质量过程,模型升级扩大能力边界,产品体验改善后又吸引更多任务和反馈。这个闭环就是“模型即产品,数据即模型”的实际含义。

一横一纵:专家知识蒸馏与 Online Learning

广密把未来路径概括为“一横一纵”。横向,是蒸馏人类专家知识,把更多行业、任务和工具链纳入模型的数据分布;纵向,是 Online Learning、Memory、主动 Agent 和新交互形态。横向可以让 AI 覆盖更多白领工作,纵向则可能让 AI 从用户和环境中持续成长。

一横一纵

横向解决“还不会哪些行业和任务”,靠专家数据、真实工作流和行业场景扩展能力边界;纵向解决“能否越用越聪明”,靠 Memory、Online Learning、主动 Agent 和长期交互。

这对创业公司有直接启发。只做一个薄 UI,很容易被基础模型公司或大平台复制;但如果能获得独特数据、专家过程、用户反馈和行业工作流,就可能在基础模型之上形成“内容资产”或“过程资产”。这也是为什么本期会反复讨论 Coding、Office、Finance、医疗、材料、机器人等具体领域。

Agentic Web:真正的 Web3?

节目中另一个重要概念是 Agentic Web。这里的 Web3 不是区块链意义上的 Web3,而是指 Agent 成为新入口后,网页、平台、支付、搜索和用户任务之间的关系被重组。过去互联网的核心入口是搜索框、App、Feed 和 Super App;Agentic Web 的核心入口可能是“我想完成一件事”。

如果 Agent 可以持续运行,它就不仅是内容消费工具,而是分配注意力、订单、流量和交易的中介。对 Uber、携程、搜索广告、手机厂商和超级应用来说,这都是重新谈判入口权的变量。

Agentic Web 的基础设施缺口

Agentic Web 不是只靠模型能力就能落地。它还需要身份、授权、支付、风控、人机验证、网站协议、审计日志和责任归属。如果这些配套跟不上,Agent 会被卡在“能演示,难规模化执行”。

投资策略:押技术成长最陡峭的地方

前面已经把产品、数据和 Agentic Web 连成闭环,本节转向投资框架。这里讨论投资不是为了给出买卖建议,而是用投资人的分类方式反向理解产业结构:钱会流向哪一层,通常意味着哪一层最稀缺、最能放大技术变化。

广密把 AI 投资策略概括为:投最领先模型、投最领先模型需要的算力和硅基基础设施、投最领先模型技术溢出的红利。这个框架对应三类资产:OpenAI/Google/Anthropic/字节这样的模型与入口公司,Nvidia/TSMC/算力基础设施这样的底层供给,以及 Cursor、Perplexity、Coding Agent、数据标注、Serving、多模态工具等技术溢出型公司。这里的 Perplexity 指 AI 搜索/问答公司名,不是语言模型评测中的 perplexity/PPL;后者是交叉熵指数化后的“困惑度”指标,用来粗略表示模型面对下一个 token 时的平均不确定性。

节目中还提到一个组合变化:从更集中押 OpenAI 与字节,转向 OpenAI、字节、Google、Anthropic、Nvidia、TSMC 等构成的篮子。背后的逻辑是交替领先和范式不确定性:如果很难判断最终赢家,就应该围绕主线做组合,而不是只押单一公司。

这不是投资建议,而是产业地图

本讲义保留节目中的投资框架,是为了理解产业结构:模型、算力、平台入口、应用溢出和数据服务如何相互拉动。它不是对任何证券或公司估值的推荐。

2026 的主题:Online Learning、知识工作者、多模态与 Agentic Web

本节把前面的技术和产业判断收束到 2026 年的观察清单。与其问“谁会最终赢”,更可操作的问题是:哪些主题会先出现可验证信号,哪些场景会先产生收入和用户行为变化。

面向 2026,节目列出几个期待主题。第一是 Online Learning 或下一范式信号;第二是更主动的 Agent 和更强 Memory;第三是围绕知识工作者的局部 L3/L4 能力,例如 Coding、Office/PPT/Excel、金融投研和长尾信息获取;第四是多模态大年;第五是 Agentic Web 对流量分配权的冲击。

这里的 L3/L4 是借用自动驾驶分级的类比:L3 可以理解为在特定条件下系统接管主要任务,人类仍需监督或接管;L4 是在限定场景内高度自动完成。广密认为“局部 L3/L4”很现实,“整体 L4”仍然很难。换句话说,先在清晰工作流中吃到经济价值,而不是等待全能 AGI。

本章小结

“模型即产品,数据即模型”把技术、产品和投资连成一个闭环。模型体验来自数据,数据来自真实任务,真实任务来自产品入口,产品入口又带来更多反馈。2026 的关键不是谁说自己更通用,而是谁能在具体场景里形成数据和产品的复利。

Neo Labs 与 Robotics:新实验室、机器人和真实世界数据

上一章讨论数据闭环,本章看硅谷新实验室和 Robotics。广密提到 SSI、Thinking Machines、Periodic Labs、Aethera、General Intuition、Reflection 等 Neo Labs,也讨论了机器人公司 Pi、Generalist、Sundee、1X、Figure、Google、Tesla 等。这一章的共同关键词仍然是数据:下一范式需要数据,机器人更需要真实世界数据。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.88\textwidth]{neo-labs-map.png}
\caption{Neo Labs 分布:自主学习、Post-training、材料模型、多 Agent、世界模型数据和开源模型。自制概念图,依据 00:56:45--00:59:43 对谈内容整理。}
\end{figure}

读图:新实验室不是同一个方向的重复创业

SSI 更像押自主学习;Thinking Machines 被视为 Post-training 与下一范式团队;Periodic Labs 聚焦材料模型;Aethera 探索 Multi-agent 环境;General Intuition 借助游戏高光数据做世界模型;Reflection 被描述为美国开源模型生态的补位。它们共同体现的是:OpenAI 人才溢出后,下一范式被多路线下注。

为什么 OpenAI 分裂后仍然强

本节回到人才组织问题,因为 Neo Labs 的出现不是偶然的创业潮,而是前沿模型公司人才、路线和经验外溢的结果。理解这些团队从哪里来,才能判断它们为什么可能不只是“又一个模型公司”。

节目中有一个很有意思的观察:OpenAI 即使分裂出 Anthropic、Ilya 的 SSI、Mira/John Schulman 等相关团队,仍然很强。Anthropic 被视为 OpenAI 早期 Scaling team 的延伸,SSI 更接近 Pre-training/自主学习方向,Thinking Machines 更接近 ChatGPT 和 Post-training 经验。这说明 OpenAI 的人才密度和范式探索曾经足够集中,以至于外溢后形成多个新中心。

但这也意味着下一阶段不一定由原来的大公司独占。新实验室可能绕过现有模型追赶赛,直接押下一代学习方式、材料科学、多 Agent 环境或世界模型数据。这就是为什么本期既强调 OpenAI 领先,也强调不要只看现有榜单。

Robotics:GPT-0.5 到 GPT-1 的阶段

机器人部分的核心判断是:进步很快,但离 GPT-4 时刻还远。广密认为今天机器人可能处于 GPT-0.5 到 GPT-1,未来两三年可能到 GPT-2/GPT-3。原因在于机器人不像语言模型那样先统一再分化。语言模型有相对统一的 token、文本语料、Transformer 和预训练路径;机器人一开始就是分化的:不同硬件、不同传感器、不同场景、不同采集方式、不同评测目标。

机器人公司现在的分化体现在数据采集上。Google 和 Pi 有遥操作真机数据;Sundee 用手套和背包采家庭数据;Generalist 宣称有大规模真机数据;世界模型和 YouTube/游戏数据也开始进入训练。每条路径都在回答同一个问题:怎样让机器人获得足够多、足够真实、足够高质量的操作数据。

术语消化:机器人数据与泛化

术语 一句话解释 本期关系
遥操作 人远程控制机器人完成任务并记录过程 提供真实动作轨迹和环境反馈。
真机数据 真实机器人在真实环境中的传感器和动作数据 比仿真更贴近落地,但采集昂贵。
跨本体 不同机器人硬件之间共享或迁移能力 解决硬件不统一导致的数据碎片化。
泛化 在未见过的新场景中仍能完成任务 机器人是否走出自动驾驶式长尾泥潭的关键。
Scaling Law 数据、模型规模和性能之间的可预测关系 如果机器人也出现规模律,产业节奏会更清楚。

机器人为什么仍然卡在“场景”

节目中提到,今天机器人主要可见场景仍集中在叠衣服、冲咖啡、家庭任务等演示或早期落地场景。硬件也变得越来越重要,有研究者甚至认为硬件可能占成功因素的很大比例。这提醒我们:机器人不是纯模型问题。它同时是感知、控制、硬件、成本、可靠性、安全、供应链、场景选择和售后运营问题。

机器人不是“把 LLM 接上手脚”

语言模型的成功路径不能直接复制到机器人。机器人要处理物理摩擦、硬件差异、传感器噪声、安全风险、长尾场景和真实世界成本。没有泛化和持续学习,机器人会长期依赖人工采集和场景工程。

本章小结

Neo Labs 和 Robotics 看似分散,其实都围绕下一阶段数据和学习效率展开。新实验室试图找到 Pre-training/RL 之外的新范式,机器人公司试图把真实世界操作变成可学习数据。二者的共同问题是:如何让模型从有限高质量数据中学到可泛化能力。

中美叙事与华人创业者:全球市场、人才红利和风险资本

最后一条主线从技术和产品转向中美叙事。广密认为,美国资本和产业空心化把大量美元、美债和资本动员到 AI 方向;中国则更像把硅谷 0-1 做产业化的后发者,拥有工程、供应链和人才优势,但近几年 0-1 创新氛围和市场化风险资本相对不足。这个判断不必当作宏大结论,适合当作创业者决策框架。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{china-founder-operating-model.png}
\caption{华人 AI 创业模型:全球市场、中国人才、风险资本、产品说话与长期目标。自制概念图,依据 01:10:16--01:18:03 对谈内容整理。}
\end{figure}

读图:先看市场,再看身份

图从全球市场开始,因为高付费地区决定收入上限;中国人才和工程能力决定成本与迭代速度;风险资本支持 0 到 1;产品说话意味着淡化身份和地缘标签;长期目标则是出现更多能同时做好中国和全球市场的跨国科技公司。

中美 AI 叙事差异

本节先把宏观叙事拆成资源结构,而不是停在情绪判断。中美差异不只是“谁更乐观”,而是资本、制造、市场、人才和产业化路径的组合不同。

广密对美国的描述是“资本驱动、数据驱动、Token 驱动”,资本追逐塔尖,制造业空心化严重,但如果 AI 成功,美国会非常强。对中国的描述则更像产业化后发优势:很多技术和产品原型可能出自硅谷,但中国公司可以依靠工程、供应链、市场和应用能力后来居上。电动车、智能手机、3D 打印机、运动相机等都被用作类比。

这个类比的隐含问题是:AI 是否也会走同样路径?如果 AI 的核心瓶颈是算力、顶尖研究员和下一范式,那么美国优势更明显;如果核心瓶颈转向工程化、应用、成本、场景和全球化运营,中国团队可能重新获得更大机会。

给华人创业者的三个建议

前面讨论宏观差异,本节转到创业者可执行的选择。对个体团队来说,最重要的不是站队宏大叙事,而是把市场、人才、资本和产品证明顺序排对。

节目中给华人创业者的建议很直接。第一,坚定做全球市场,尤其是高付费能力市场。第二,用好中国工程师和产业优势,不要放弃人才红利。第三,淡化身份和地缘标签,把产品做好,让产品说话。对早期公司来说,能拿什么钱就多拿什么钱,因为跨境信任链、美国一线 VC、身份和地缘因素都会增加难度。

创业者的现实排序

先证明产品价值,再争取资本和叙事改善。身份包装无法替代产品,地缘叙事也无法替代收入、留存、效率和用户真实付费。

为什么希望中国有自己的硅谷

本节从创业者建议再往上走一步,讨论创新生态本身。所谓“中国有自己的硅谷”,在这里不是地理复制,而是希望年轻人、风险资本、算力、研究文化和全球化市场能形成更密的正反馈。

本期结尾的情绪不是民族主义口号,而是对创新生态的担忧。广密回忆中国移动互联网早期的 0-1 创新氛围:移动支付、二维码、直播、微信、O2O 等都曾让中国创业者非常自豪。过去几年,全球 AI 应用独角兽大量出现,但中国团队占比不如互联网时代,这让他觉得可惜。

他认为年轻人的高风险创新需要风险资本支持。人才基础很强,但人才不是唯一要素;还需要资本、算力、创新环境、失败容忍度、全球市场经验和顶尖研究文化。三到五年后最领先 AI 公司是否会由华人团队做出,概率比过去高,但仍取决于这些变量能否补齐。

本章小结

中美叙事的实用价值在于帮助创业者定位资源:美国有资本、前沿研究和高付费市场,中国有工程、人才、供应链和应用能力。华人创业者真正的机会,不在身份叙事里,而在能否把全球市场、中国人才和产品执行力组合起来。

术语消化:本期关键词索引

本期术语密度很高,且许多词在不同语境中含义不同。下面把核心词放在同一张表里,帮助读者复盘。

术语 一句话解释 在本期中的作用
AI War AI 竞争像输不起的军备竞赛 替代单纯泡沫叙事,解释巨头和国家持续投入。
AI Bubble 估值和资本开支是否过热的争论 节目开场问题,但不是最终分析框架。
SOTA State of the art,当前最先进水平 被提醒不能只看 benchmark,要看用户和收入。
Benchmark 用测试集衡量模型能力的榜单或指标 有参考价值,但可能被刷分或脱离真实任务。
ARR Annual Recurring Revenue,年度经常性收入 衡量 AI Native 公司商业化速度。
DAU/MAU 日活/月活用户数 比较 ChatGPT 与 Gemini 用户频率和入口心智。
Pre-training 用海量数据训练基础模型 被比作石油,量大但逐渐接近上限。
RL/Post-training 用反馈、偏好、专家轨迹继续塑形模型 被比作新能源,有用但总量和成本受限。
Online Learning 从持续交互中学习并改进未来行为 本期第三范式,也是改变格局的关键变量。
Continuous Learning 持续学习,常与 Online Learning 近义使用 强调模型长期吸收新经验。
Memory 保存用户、任务和历史上下文的能力 是主动 Agent 和 Online Learning 的基础设施之一。
LoRA Low-Rank Adaptation,用低秩参数高效适配模型 节目提到可作为新范式基础设施之一。
MoE Mixture of Experts,按输入激活部分专家网络 用来解释模型激活参数未必无限变大,稀疏度提高。
Agentic Web Agent 成为入口后重组网页、工具、支付和平台分发 影响搜索广告、Super App 和交易抽成。
模型即产品 用户感知的产品体验越来越由模型能力决定 说明模型升级会直接改变应用价值。
数据即模型 模型差异最终来自数据分布和反馈闭环 说明创业公司必须拥有差异化数据。
专家蒸馏 把高水平专家工作过程变成训练数据 横向扩展行业能力的关键。
局部 L3/L4 借自动驾驶分级类比特定场景的高自动化 比整体 AGI 更现实的商业落点。
Neo Labs 从大厂和 OpenAI 溢出的新实验室群体 承载下一范式、多 Agent、材料和开源模型探索。
Robotics 机器人智能与实体执行系统 检验泛化、数据和硬件协同的真实世界方向。

本章小结

这些术语共同指向同一件事:AI 竞争已经从单点模型能力,扩展为数据、产品、入口、算力、组织、资本和国家战略的复合系统。理解术语之间的关系,比记住某个季度的榜单排名更重要。

总结与延伸

核心结论

最后这一节把全篇从产业叙事重新压缩成可复用判断。读者不需要记住每个公司数字,但应该带走一套判断 AI 竞争的层次图:资本开支、模型范式、入口、数据和创业生态怎样互相约束。

本期的主线可以压缩成九个结论。

  1. AI Bubble 只能解释估值情绪,AI War 才能解释巨头和国家为什么持续投入。
  2. OpenAI 的看得见收入来自订阅、广告电商和 API,看不见收入来自 Agent 替代劳动和 AI 做高价值增量任务。
  3. Nvidia GPU 与 Google TPU 代表开放生态和垂直整合两条硬件/云/模型路线。
  4. GPT、Claude、Gemini 的交替领先会成为常态,直到下一范式真正拉开差距。
  5. 基础模型公司像综合电商,Scale Data 的效率很高,创业公司必须找到差异化数据和工作流。
  6. Google 王者归来不等于危机解除,ChatGPT 也不只是聊天工具;二者都在争夺搜索和个人助理入口。
  7. Pre-training 像石油,RL 专家数据像新能源,Online Learning 像尚未突破的核聚变。
  8. “模型即产品,数据即模型”意味着 AI 产品的护城河要回到数据分布、用户反馈和专家过程。
  9. 华人 AI 创业者的机会来自全球市场、中国人才、工程能力和产品说话,而不是身份包装。

开放问题

这些问题决定 2026 年之后的分叉。

  • Online Learning 会在 2026 年出现清晰信号,还是继续停留在研究叙事?
  • ChatGPT 融合搜索的速度,会不会快于 Google 自我革新的速度?
  • Gemini 的多模态和 Android 生态,能否转化为高频个人助理心智?
  • Anthropic 的 Coding 和企业战略 Beta,能否继续抵抗 OpenAI 和 Google 的横向扩张?
  • Agentic Web 的支付、授权、人机验证和网站协议,谁会率先标准化?
  • Robotics 的数据路线会收敛,还是继续长期分化?
  • 中国团队能否在全球 AI 应用独角兽中重新获得互联网时代那样的占比?

拓展阅读

  • EP136 全球大模型季报第 9 集:Coding、模型 OS 与硅谷御三家。
  • EP134 数据综述:数据金字塔、Recipe、标注与定价。
  • EP139 Agent 技术史综述:Agent 的技术谱系和社会辐射。
  • EP130 张月光访谈:AI Native 产品、上下文设计和 Agent 产品方法。
  • OpenAI、Anthropic、Google DeepMind、SSI、Thinking Machines 相关公开访谈与技术报告:理解下一范式和 Post-training 路线。

最后的判断

EP127 最值得留下的是一个跨层框架:AI 的竞争不是单纯模型榜单,也不是单纯资本泡沫,而是算力、数据、入口、产品、学习范式和国家战略同时变化。未来赢家不一定是某个季度 benchmark 最强的公司,而是能把真实数据、持续学习和用户入口连成闭环的系统。