Ep127 Sg90Aehv3Vu
导读:为什么这期要当作一份季度讲义来读
本期是“全球大模型季报”的跨年对谈。它不是普通人物访谈,而是一次面向 2026 年的 AI 产业、模型范式和投资主线复盘。张小珺负责把问题推进到商业、平台和创业层面,广密则把一组季度观察压缩成几个关键词:AI War、交替领先、基础模型像综合电商、OpenAI 与 Google 的双主线、Pre-training/RL/Online Learning 三种范式,以及“模型即产品,数据即模型”。
因此,本讲义不按原始字幕逐句展开,而按教学逻辑重组为六条主线。第一条是为什么“AI Bubble”不足以解释这一轮投入,AI 更像输不起的军备竞赛;第二条是 OpenAI 的收入账与 Google/OpenAI 的入口之争;第三条是 GPT、Claude、Gemini 的交替领先与基础模型公司的平台类比;第四条是第三范式 Online Learning;第五条是数据、Agentic Web、Neo Labs 与 Robotics;第六条是中美叙事、华人创业者和未来三到五年的长期变量。
本期核心命题
广密的中心判断不是“没有泡沫”,而是“泡沫框架太窄”。AI 的投入同时被商业防守、国家战略、算力供给、人才竞争和下一范式预期驱动。它更像 AI War:没人确定短期账一定算得过来,但关键玩家都不敢下牌桌。
视觉策略说明
本视频没有 slides、白板、论文画面或产品演示。按照播客工作流,正文只使用封面做来源识别,不重复插入固定访谈画面;正文中的图均为自制概念图,用来承载结构关系,细节解释放在文字、表格和读图框里。
本章小结
EP127 的价值在于把过去几期反复出现的模型、数据、Agent、算力和创业话题压缩成一个跨年判断:2026 年要看的不是单个 benchmark,而是范式是否变化、入口如何重分配、谁能把数据和产品做成闭环。
从 AI Bubble 到 AI War:为什么“泡沫”不是充分解释
本节先处理全片的总框架。节目开头问的是“AI Bubble”,广密给出的回答却是“更像 AI War”。这不是文字游戏,而是分析单位的变化。如果只把 AI 当成商业项目,就会从现金流、估值和资本开支出发,问“这笔钱怎样赚回来”;如果把 AI 当成下一代平台、国防能力和科技秩序重组,就还要问“如果不投,会不会被颠覆”。
图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{ai-war-alliances.png}
\caption{AI War 的两条主线:Nvidia GPU 生态、Google TPU 生态,以及围绕 OpenAI/Google 形成的反制联盟。自制概念图,依据 00:15:04--00:17:48 对谈内容整理。}
\end{figure}
读图:这张图先看生态,再看联盟
左上和中上分别是 Nvidia GPU 与 Google TPU 两条硬件生态主线。OpenAI、Anthropic 等领先模型公司更多站在 GPU 生态中;Google 则在模型、芯片、云和产品端到端整合。下方的“反 Google 联盟”和“反 OpenAI 联盟”提醒我们:越强的单一玩家,越会触发其他巨头、资本和生态伙伴的制衡。
AI War 的第一层含义:商业防守
前面说 AI War 不是修辞,本节先看商业层面的输不起。广密举了两个现实例子。第一个是云厂商被模型白牌化:过去开发者和企业优先考虑 AWS、Azure 或 Google Cloud,现在很多新应用先问“用哪个模型”:GPT、Claude 还是 Gemini。云仍然重要,但用户心智可能从云迁移到模型。
第二个是 Agent 可能成为新流量入口。传统搜索、Super App、OTA、出行、招聘和电商平台,许多商业模式都建立在信息分发、匹配和交易抽成上。如果 Agent 能替用户比较、谈判、下单、支付和跟踪,平台的抽成和入口权就会被重新定价。对巨头来说,这不是“多一个工具”,而是已有利润池的防守战。
误读警告:AI War 不等于短期账一定成立
说 AI 是战争,不代表每个数据中心项目、每个模型训练计划和每家创业公司都值得投资。它只说明关键玩家的行为不能用普通 SaaS 投资回报周期解释,因为“不投入”的机会成本可能是平台地位被重写。
AI War 的第二层含义:国家战略和算力动员
广密进一步把 AI 比作新的国防和核武器。这句话容易被听成夸张,但它指向的是国家层面的能力结构:谁掌握更强模型、更多算力、更密集研究员、更完整芯片供应链,谁就可能在软件生产、科学发现、军事辅助、产业自动化和信息分发上获得系统性优势。
这也是为什么短期现金流算不过来的项目仍会获得资本和政策支持。商业公司担心被颠覆,国家担心战略落后,资本市场又在寻找少数能吸纳巨大资金并仍有上行想象的方向。三者叠加后,AI 资本开支的节奏就很难只用“泡沫”二字解释。
分析 AI 投入的三层账
| 账本 | 关心的问题 | 对应本期判断 |
|---|---|---|
| 财务账 | 收入、毛利、现金流、折旧如何覆盖投入 | OpenAI 的 1.4T 承诺短期会被质疑。 |
| 平台账 | 新入口会不会替代旧入口,谁掌握用户关系 | Agent 与模型云可能重写搜索、云和 Super App。 |
| 战略账 | 如果不投入,国家和公司是否失去未来能力 | AI 被类比为国防和核武器,玩家不敢轻易离场。 |
从泡沫争论转向格局分析
泡沫争论常常问“估值是不是太高”。本期更值得保留的问题是“谁会被迫继续投入、谁能形成联盟、谁能让投入变成产品和数据闭环”。这也是后文的展开顺序:先拆 OpenAI 的收入账,再看 Nvidia/Google 阵营,然后讨论三大模型为什么交替领先,最后进入 Online Learning 这个可能改变现有格局的变量。
本章小结
AI War 框架把讨论从估值情绪拉回结构变量。它不否认局部泡沫,却提醒读者:当 AI 同时威胁云、搜索、Super App、白领劳动和国家竞争力时,巨头和国家会用比普通商业项目更激进的方式投入。
OpenAI 收入账:看得见的收入与看不见的潜在收入
上一章解释了为什么巨头不容易下牌桌,本章把镜头收回到 OpenAI。围绕 OpenAI 最大的争议,是巨额算力承诺与未来现金流是否匹配。广密的拆法很有教学意义:先分“看得见的收入”,再分“看不见的收入”。前者像互联网平台和云服务,后者则取决于 Agent 能否替代劳动、AI 能否做出人类做不了的高价值任务。
图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.92\textwidth]{openai-revenue-stack.png}
\caption{OpenAI 收入栈:订阅、广告电商、API、Agent 劳动与 AI 科学家。自制概念图,依据 00:07:38--00:13:10 与 00:13:32--00:15:04 对谈内容整理。}
\end{figure}
读图:从“互联网平台收入”看到“劳动预算”
前三层是相对看得见的收入:订阅、广告电商和 API。后两层更难估计:Agent 如果能端到端替代白领工作,就吃到工资预算;AI 如果能写 CUDA、做科学发现或寻找新材料,就创造现在没有被人类充分完成的增量价值。
看得见的收入:订阅、广告电商和 API
广密的第一类收入是订阅。可用一个简化公式表示:
其中,\(R_{\text{sub}}\) 表示订阅年收入;\(U\) 表示月活或可触达用户规模;\(p\) 表示付费率;\(a\) 表示单个付费用户的年均收入。节目中给出的乐观估计是:如果 ChatGPT 做到数十亿级活跃用户,且 10% 左右用户付费,订阅收入可以进入数百亿美元量级。这一类推来自 Office、Netflix 等成熟订阅产品。
第二类收入是广告和电商。逻辑是:大流量、高频、有粘性的入口最终会变现。短视频和手机广告早期也被质疑过屏幕小、场景不适合,但后来证明用户注意力在哪里,广告和交易就会迁移到哪里。ChatGPT 如果融合搜索、推荐、购物和服务撮合,就可能从传统搜索广告和平台抽成中拿走一部分。
第三类收入是 API,也就是“模型云”。广密把它类比为 Amazon 从电商中生长出 AWS:当公司自身需要巨大计算、数据和工程系统时,这套能力也可以对外服务开发者。对 OpenAI 来说,模型能力越强、成本越低、开发者生态越大,API 收入就越像新的云业务。
看得见收入的共同前提
订阅、广告电商和 API 都依赖同一件事:ChatGPT 必须保持大流量、高频使用、强品牌和足够好的模型体验。如果用户入口迁移到 Gemini、手机厂商或垂直 Agent,这三类收入的上限都会被压低。
看不见的收入:Agent 替代劳动
更大的想象来自劳动预算。工具软件卖的是效率,Agent 如果真正端到端完成任务,卖的就可能是“替代一部分工资”。软件开发是最早出现这种信号的行业:AI Coding 在一年内长出百亿美元级别市场,说明知识工作中确实存在可被模型迅速吸收的任务。
但这里有两个关键门槛。第一,Agent 必须可靠到能够承担责任,不只是生成建议;第二,企业必须愿意把预算从人力、外包或传统软件迁移到 AI 系统。只有越过这两个门槛,AI 才不只是“帮员工更快”,而是成为新的劳动供给。
工具预算与工资预算不是一回事
一个员工愿意每月为工具付几十美元,不等于公司愿意把一个岗位预算交给 Agent。后者要求稳定性、权限控制、审计、责任归属和可预期结果。很多 AI 公司会卡在“很好用的工具”,而不是“能吃工资预算的系统”。
更远的收入:AI 做人做不了的事
广密还提到另一类看不见收入:AI 可能完成现在人类做不了或做得很慢的高价值任务,例如重写 CUDA、发现新材料、加速医学研究、寻找室温超导线索,甚至“AI 做 AI 科学家”。这类收入不能简单归入存量替代,因为它可能创造新问题、新市场和新科学路径。
这里的前提更强:模型不仅要会调用现有知识,还要在长期实验、反馈、推理、记忆和自主学习中改进。这就自然引出后文的 Online Learning。换句话说,OpenAI 的长期收入想象越大,对模型可靠性、持续学习和真实环境反馈的要求越高。
本章小结
OpenAI 收入账可以分成三层:订阅、广告电商和 API 是看得见的平台收入;Agent 替代白领劳动是更大的存量迁移;AI 做科学发现和高价值增量任务,则依赖更根本的模型能力突破。短期质疑来自财务账,长期乐观来自平台账和范式账。
两大阵营与三大模型:交替领先为什么会成为常态
前两章讨论投入和收入,本章进入竞争格局。这里的问题是:如果大家都继续投钱,产业会围绕哪些主线组织起来?广密把 AI War 的硬件生态简化成两条主线:Nvidia GPU 生态和 Google TPU 生态;把应用/模型层主线简化成 OpenAI、Anthropic、Google Gemini 的三强交替领先。这个简化很有用,因为它避免把每个季度的新榜单都当成终局,也提醒我们把“谁短期领先”放回更长期的生态竞争中理解。
Nvidia GPU vs Google TPU
本节先从底层硬件生态讲起,因为模型公司的能力、成本和迭代速度都要落在芯片、软件栈和云供给上。理解 GPU 与 TPU 的差异,才能理解为什么同样是模型竞争,Google 和 Nvidia 代表的是两种完全不同的产业组织方式。
TPU 是 Google 自研的 Tensor Processing Unit,面向机器学习训练和推理优化;GPU 是 Nvidia 主导的通用并行计算生态,围绕 CUDA、开发者、云服务、服务器、网络和供应链形成了强大网络效应。Google 的优势是端到端:模型、芯片、云、搜索、Android、YouTube 和 Workspace 都在一个公司内;Nvidia 的优势是开放生态:OpenAI、Anthropic、xAI、Meta、云厂商和创业公司都可以围绕 GPU 形成外部创新网络。
广密把 Google 比作 AI 时代的苹果,把 Nvidia 比作 AI 时代的安卓。这不是说二者完全等价,而是指出两种组织方式:垂直整合与开放生态。前者在产品和成本上可能形成闭环,后者在开发者、多公司创新和供给扩张上更有弹性。
术语消化:GPU、TPU 与 CUDA
| 术语 | 解决的问题 | 本期关系 |
|---|---|---|
| GPU | 用大规模并行计算加速矩阵运算和深度学习 | Nvidia 生态的核心,支撑 OpenAI/Anthropic 等外部模型公司。 |
| TPU | Google 为机器学习定制的加速芯片 | 支撑 Google 从芯片到 Gemini 的垂直闭环。 |
| CUDA | Nvidia 的并行计算软件生态 | 让 GPU 不只是硬件,而是开发者和工程工具链。 |
| 生态位 | 公司在产业链里的稳定位置 | Google 做全栈,Nvidia 做底层生态,模型公司做能力和产品。 |
GPT、Claude、Gemini 的交替领先
三大模型的交替领先,是本期最重要的格局判断之一。广密认为,在现有 Pre-training 加 RL/Post-training 范式下,顶尖团队的方法、人才和信息流动很快,单家公司很难长期拉开巨大差距。于是竞争从“谁一次性碾压”变成“谁在某个战略 Beta 上端到端优化得更彻底”。
图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{top-model-rotation.png}
\caption{三大模型交替领先:GPT、Claude、Gemini 的战略重点不同。自制概念图,依据 00:17:48--00:25:40 对谈内容整理。}
\end{figure}
读图:交替领先不是没有分化
GPT 更强在 C 端产品、品牌和个人助理心智;Claude 更强在 Coding、企业和知识工作者体验;Gemini 更强在多模态、Google 生态和 Android/搜索分发。交替领先说明通用能力难以长期拉开,但分化说明每家公司会围绕自己的数据和产品目标优化。
Benchmark SOTA 的误读
SOTA 原意是 state of the art,即当前最先进水平。但本期强调:榜单 SOTA 不等于商业 SOTA。真正重要的指标可能是营收、客户、日活、留存、tokens 输出、任务成功率和用户愿意交付多少真实工作。
基础模型公司为什么像综合电商
广密提出一个“偷懒但有用”的类比:基础模型公司像十年前的综合电商,Scale SKU 类比 Scale Data。综合电商从书扩展到全品类时,可以复用仓储、物流、支付、流量和用户关系;基础模型公司从聊天扩展到 Coding、Office、投研、医疗、设计和多模态时,也可以复用模型架构、数据管线、评测系统、RL 流程和用户入口。
图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.94\textwidth]{foundation-model-as-ecommerce.png}
\caption{基础模型 = 综合电商:Scale SKU 类比 Scale Data。自制概念图,依据 00:25:40--00:27:40 对谈内容整理。}
\end{figure}
读图:类比的重点是“复用基础设施”
综合电商能从图书扩到全品类,不只是因为想卖更多东西,而是仓配、支付、推荐和用户信任可以复用。基础模型公司能从聊天扩到 Coding、Office 和行业 Agent,也不是简单加功能,而是数据采集、训练、评测和产品反馈管线可以复用。
这个类比对创业者有两个提醒。第一,垂直场景不一定没有价值,但要知道自己是在做“垂直电商”还是在做“小红书”。垂直电商可能赚钱,但平台上限受限;小红书在综合电商之外构建内容资产和社区心智,才有不同价值。第二,模型公司向下做数据的效率更高,创业公司必须找到基础模型公司不容易获得的差异化数据、工作流或用户关系。
本章小结
本章把竞争格局拆成硬件生态、模型三强和平台类比。交替领先说明现有范式下技术差距难以永久拉开;战略 Beta 和数据闭环则决定每家公司在哪里建立特色。基础模型像综合电商,意味着“横向扩品类”的能力很强,创业公司必须避开被轻易 Scale Data 的位置。
Google、OpenAI 与 Search:入口权如何重分配
上一章说明 Google 和 OpenAI 都在核心牌桌上,本章专门讨论两者的入口竞争。节目中最有张力的判断是:Google 王者归来不等于危机解除,ChatGPT 也不只是一个边缘聊天工具。二者最终可能在搜索、个人助理、移动端和广告预算上直接相遇。
Gemini 崛起后,OpenAI 为什么仍然强
广密对 OpenAI 的看法偏乐观,原因有三。第一,OpenAI 可能是过去二十年里少数真正有机会挑战 Google 的公司。微软 Bing 也没有从根本上改变搜索入口,但 ChatGPT 把用户心智从“搜索答案”迁移到“让 AI 帮我理解、生成、执行”。第二,OpenAI 仍是最好的 AI 标的之一:人才密度、产品感、品牌和用户规模都很强。第三,OpenAI 仍有较高概率参与下一范式探索,这对长期估值很关键。
Google 的优势同样真实:Gemini、多模态、Android、Search、YouTube、Workspace、Cloud、TPU、Waymo 等资产形成了很厚的底盘。问题在于,Google 的强并不自动消灭 OpenAI;这可能是一个双巨头甚至多巨头长期并存的市场。
Search 会怎样被 Agent 重写
前面说 Google 的危机没有真正解除,问题就落到 Search 上:搜索不是一个单独功能,而是广告、网页分发、商家流量和用户决策的总入口。本节把传统搜索流程和 Agent 流程并排看,才能看出流量重分配为什么会触及 Google 的利润核心。
搜索的传统流程是:用户输入关键词,搜索引擎返回链接、摘要和广告,用户再点击、比较、购买或继续搜索。Agent 流程则可能是:用户给目标,Agent 搜索、比较、调用工具、议价、下单、支付、跟踪,最后返回结果。两者差异不只是界面,而是价值链位置。
图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{search-agent-disruption.png}
\caption{Search 与 Agent 的流量重分配:从搜索链接到任务完成。自制概念图,依据 00:31:20--00:35:08 与 00:50:57--00:52:53 对谈内容整理。}
\end{figure}
读图:Agent 抢的是分配权
图中用户目标先进入 Agent,而不是直接进入搜索框或 Super App。Agent 再决定调用搜索、票务、出行、支付或企业系统。谁控制这个入口,谁就有机会重新分配广告、交易、抽成和用户数据。
Agent 不会瞬间消灭搜索
Agent 要真正改写搜索广告,必须解决引用可信度、实时信息、支付、权限、商家接入、反作弊、审计和责任归属。短期更可能是混合形态:传统搜索融合 AI,ChatGPT 融合搜索,二者互相侵蚀。
ChatGPT 的移动端心智与 Gemini 的生态心智
接下来需要从入口机制转到用户心智,因为同样能回答问题的模型,最终可能在完全不同的时间、设备和场景里被打开。本节讨论的是使用频率和生活位置,而不只是模型能力。
节目中提到一个非常产品化的观察:ChatGPT 更像生活助理,很多用户会在周末、移动端和日常生活中使用;Gemini 在一些场景中更像工作时间的生产力工具,且依托 Android 和新兴市场有天然分发优势。这个差异意味着,模型能力之外,使用频率、场景温度和用户心智同样重要。
如果 ChatGPT 能成为 10--20 亿日活级别的个人助理,它的商业化根基会非常稳;如果 Gemini 能把 Android、Search、Workspace 和多模态真正串起来,Google 也可能在 AI 时代继续保持强势。两条路径不是互斥,而是在争夺用户最先打开哪个入口。
本章小结
Google 的危机从“会不会错过 AI”变成“能不能在 Agent 入口里继续掌握分配权”。OpenAI 的挑战从“能不能做出好模型”变成“能不能把 ChatGPT 扩展成高频、可靠、可变现的个人助理和搜索/执行入口”。这一章的结论是:入口战争刚开始,模型榜单只是其中一小部分。
第三范式 Online Learning:为什么它可能比机器人、世界模型、多模态更根本
前面讨论的是现有竞争格局,本章进入技术范式。广密认为 Pre-training scaling 快结束了,RL/Post-training 仍有空间,但下一阶段真正可能改变格局的是 Online Learning 或 Continuous Learning。这里的核心不是“模型有更长上下文”这么简单,而是模型能否从交互、反馈和真实任务中持续学习。
图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{scaling-paradigm-shift.png}
\caption{三种学习范式:Pre-training、RL/Post-training、Memory 与 Online Learning。自制概念图,依据 00:36:01--00:41:01 对谈内容整理。}
\end{figure}
读图:从静态压缩走向交互学习
Pre-training 像一次性压缩大规模互联网和专业数据;RL/Post-training 用人类反馈、专家过程和任务结果塑形;Memory 和长上下文让模型记住更多用户与任务历史;Online Learning 进一步要求模型在推理和交互过程中真正更新自己,越用越懂用户、越做越会做。
Pre-training:巨大的压缩器
Pre-training,即预训练,是用海量文本、代码、多模态数据训练模型,让它学会预测下一个 token 或下一段结构。广密强调,今天的模型仍然像巨大的压缩器:数据分布里没有的任务往往不 work,只有压缩过类似数据,模型才更可靠。
这句话很关键。它解释了为什么模型在知识层面已经超过多数人,却在真实工作流里仍会失败。因为真实工作不是只回答问题,而是要进入 CRM、财务系统、设计软件、医院流程、销售现场、企业权限和具体工具链。模型如果没有见过足够多真实过程,就只能靠泛化猜测。
压缩器视角
模型不是凭空“懂”任务,而是把训练数据中的模式压缩成参数和表示。一个任务如果长期没有进入数据分布,模型就很难稳定完成;要让 Agent 可靠,必须把真实工作过程变成可学习的数据。
RL/Post-training:专家数据与任务反馈
前面把预训练解释为大规模压缩,本节进一步看“压缩之后怎样塑形”。如果说 Pre-training 让模型学到世界上已经存在的大量模式,那么 RL/Post-training 更关心模型怎样在具体任务、用户偏好和专家过程里变得可用。
RL 是 Reinforcement Learning,强化学习。它不只是“奖励模型”四个字,而是一套让系统根据结果反馈调整行为的训练方式。在大模型语境下,Post-training 通常包括指令微调、人类偏好反馈、专家轨迹、自动评测、工具使用反馈和任务结果评分。节目中把这类数据比作“新能源”:有用,但总量较少,采集成本高。
如果 Coding Agent 要变强,需要高质量代码、真实 issue、测试、PR 反馈和长期软件工程过程;如果医疗 Agent 要变强,需要医生诊断过程、病例、检查、用药、随访和责任边界;如果投研 Agent 要变强,需要分析师工作流、数据来源、模型假设和错误复盘。每一类都不是普通网页文本,而是专家过程数据。
术语消化:RL/Post-training 相关词
| 术语 | 核心机制 | 本期作用 |
|---|---|---|
| RL | 用奖励或结果反馈优化策略 | 让模型不只模仿文本,还能朝任务成功优化。 |
| Post-training | 预训练后的对齐、指令、偏好和任务训练 | 决定模型是否符合产品目标。 |
| 专家轨迹 | 金牌专家完成任务的过程记录 | 让模型学习真实工作流,而不只是答案。 |
| Credit assignment | 把成功或失败归因到中间步骤 | Robotics 章节中用来解释每一步是否有利于任务成功。 |
| Value function | 估计当前状态或动作未来价值的函数 | 帮助系统知道哪些步骤更接近成功。 |
Online Learning:边交互边学习
Online Learning 在本期中指模型自主学习、持续学习、从交互中吸收用户和任务经验。与静态预训练不同,它要求模型在使用过程中变得更懂用户、更懂任务、更主动。广密举的产品图景是:今天 ChatGPT 必须等用户 prompt;未来 AI 可能在后台反思、准备、联想,下一次用户提问时已经有了更深的理解。
这个能力一旦成立,会改变产品形态。AI 不再是每次从零推理的工具,而是和用户共同成长的长期伙伴;不再只是回答当前问题,而是记住用户目标、偏好、项目、上下文和历史错误;不再只是被动等命令,而是主动准备和提醒。
Online Learning 的定义
在本讲义中,Online Learning 指模型或 AI 系统能从持续交互、任务结果和用户反馈中学习,并把学习结果稳定用于未来行为。它不是简单保存聊天记录,而是把经验转化为能力、偏好或策略更新。
Memory 不等于 Online Learning
Memory 可以只是存储用户信息;长上下文可以只是把更多历史塞进 prompt。Online Learning 要求系统从这些历史里学到可泛化的行为改进。只会“记住事实”不等于会“越用越聪明”。
能源隐喻:石油、新能源与核聚变
本节用能源隐喻把前三个学习阶段压缩成一个容易记住的比较框架。这个隐喻的价值不在于精确预测技术路线,而在于帮助读者同时看到存量数据、专家数据和持续学习三类资源的约束差异。
广密用三个能源隐喻解释范式差异:Pre-training 数据像石油,量大但有限;RL 专家数据像新能源,有用但总量少;Online Learning 像核聚变,还没有真正突破,但如果突破,能量密度和上限会完全不同。
图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{energy-metaphor.png}
\caption{能源隐喻:石油、新能源和核聚变对应三类数据与学习方式。自制概念图,依据 00:41:01--00:43:05 对谈内容整理。}
\end{figure}
读图:隐喻的边界
石油强调存量数据有限,新能源强调专家数据有用但采集困难,核聚变强调 Online Learning 的潜在上限。隐喻不说明技术一定会按能源史重演;它只是帮助我们区分三类数据和学习机制的约束。
为什么说机器人、世界模型和多模态可能是“假问题”
节目中最容易引发争议的一句话是:机器人、世界模型、多模态很多可能是假问题,Online Learning 才是真问题。这里的“假问题”不是说这些方向不重要,而是说它们可能依赖更底层的泛化和持续学习。如果没有泛化,机器人就会像自动驾驶一样:每个长尾场景都要采数据、标数据、调规则,长期陷入“有多少人工就有多少智能”。
多模态和世界模型也类似。模型能看视频、生成图像、预测物理过程,不等于它能从真实环境中持续学习、迁移经验、处理新任务。真正难的是把经验变成可复用能力。Online Learning 如果突破,机器人、世界模型和多模态都可能获得更强泛化;如果不突破,这些方向就会继续被数据量、标注成本和真实环境复杂度拖住。
本章小结
第三范式的核心不是一个新名词,而是从静态压缩走向持续交互学习。Pre-training 解决大规模知识压缩,RL/Post-training 解决任务反馈和专家过程,Online Learning 则试图解决“越用越聪明”和“从真实环境中泛化”的问题。它之所以重要,是因为它可能改变现有三强交替领先的平衡。
模型即产品,数据即模型:Agentic Web 与投资主线
上一章说 Online Learning 需要真实交互和反馈,本章把这个判断落到产品、数据和投资策略。广密反复强调“模型即产品,数据即模型”。这句话看似绕口,其实非常具体:过去几年最大的体验升级来自模型升级,而模型升级的根部又来自数据分布升级。谁能拿到差异化数据,谁就能在模型和产品上形成差异。
图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{model-data-product-loop.png}
\caption{模型即产品,数据即模型:用户任务、交互数据、专家蒸馏、模型升级和产品体验构成闭环。自制概念图,依据 00:43:05--00:56:45 对谈内容整理。}
\end{figure}
读图:产品体验回到数据分布
用户任务暴露真实工作流,交互数据记录偏好和失败点,专家蒸馏补足高质量过程,模型升级扩大能力边界,产品体验改善后又吸引更多任务和反馈。这个闭环就是“模型即产品,数据即模型”的实际含义。
一横一纵:专家知识蒸馏与 Online Learning
广密把未来路径概括为“一横一纵”。横向,是蒸馏人类专家知识,把更多行业、任务和工具链纳入模型的数据分布;纵向,是 Online Learning、Memory、主动 Agent 和新交互形态。横向可以让 AI 覆盖更多白领工作,纵向则可能让 AI 从用户和环境中持续成长。
一横一纵
横向解决“还不会哪些行业和任务”,靠专家数据、真实工作流和行业场景扩展能力边界;纵向解决“能否越用越聪明”,靠 Memory、Online Learning、主动 Agent 和长期交互。
这对创业公司有直接启发。只做一个薄 UI,很容易被基础模型公司或大平台复制;但如果能获得独特数据、专家过程、用户反馈和行业工作流,就可能在基础模型之上形成“内容资产”或“过程资产”。这也是为什么本期会反复讨论 Coding、Office、Finance、医疗、材料、机器人等具体领域。
Agentic Web:真正的 Web3?
节目中另一个重要概念是 Agentic Web。这里的 Web3 不是区块链意义上的 Web3,而是指 Agent 成为新入口后,网页、平台、支付、搜索和用户任务之间的关系被重组。过去互联网的核心入口是搜索框、App、Feed 和 Super App;Agentic Web 的核心入口可能是“我想完成一件事”。
如果 Agent 可以持续运行,它就不仅是内容消费工具,而是分配注意力、订单、流量和交易的中介。对 Uber、携程、搜索广告、手机厂商和超级应用来说,这都是重新谈判入口权的变量。
Agentic Web 的基础设施缺口
Agentic Web 不是只靠模型能力就能落地。它还需要身份、授权、支付、风控、人机验证、网站协议、审计日志和责任归属。如果这些配套跟不上,Agent 会被卡在“能演示,难规模化执行”。
投资策略:押技术成长最陡峭的地方
前面已经把产品、数据和 Agentic Web 连成闭环,本节转向投资框架。这里讨论投资不是为了给出买卖建议,而是用投资人的分类方式反向理解产业结构:钱会流向哪一层,通常意味着哪一层最稀缺、最能放大技术变化。
广密把 AI 投资策略概括为:投最领先模型、投最领先模型需要的算力和硅基基础设施、投最领先模型技术溢出的红利。这个框架对应三类资产:OpenAI/Google/Anthropic/字节这样的模型与入口公司,Nvidia/TSMC/算力基础设施这样的底层供给,以及 Cursor、Perplexity、Coding Agent、数据标注、Serving、多模态工具等技术溢出型公司。这里的 Perplexity 指 AI 搜索/问答公司名,不是语言模型评测中的 perplexity/PPL;后者是交叉熵指数化后的“困惑度”指标,用来粗略表示模型面对下一个 token 时的平均不确定性。
节目中还提到一个组合变化:从更集中押 OpenAI 与字节,转向 OpenAI、字节、Google、Anthropic、Nvidia、TSMC 等构成的篮子。背后的逻辑是交替领先和范式不确定性:如果很难判断最终赢家,就应该围绕主线做组合,而不是只押单一公司。
这不是投资建议,而是产业地图
本讲义保留节目中的投资框架,是为了理解产业结构:模型、算力、平台入口、应用溢出和数据服务如何相互拉动。它不是对任何证券或公司估值的推荐。
2026 的主题:Online Learning、知识工作者、多模态与 Agentic Web
本节把前面的技术和产业判断收束到 2026 年的观察清单。与其问“谁会最终赢”,更可操作的问题是:哪些主题会先出现可验证信号,哪些场景会先产生收入和用户行为变化。
面向 2026,节目列出几个期待主题。第一是 Online Learning 或下一范式信号;第二是更主动的 Agent 和更强 Memory;第三是围绕知识工作者的局部 L3/L4 能力,例如 Coding、Office/PPT/Excel、金融投研和长尾信息获取;第四是多模态大年;第五是 Agentic Web 对流量分配权的冲击。
这里的 L3/L4 是借用自动驾驶分级的类比:L3 可以理解为在特定条件下系统接管主要任务,人类仍需监督或接管;L4 是在限定场景内高度自动完成。广密认为“局部 L3/L4”很现实,“整体 L4”仍然很难。换句话说,先在清晰工作流中吃到经济价值,而不是等待全能 AGI。
本章小结
“模型即产品,数据即模型”把技术、产品和投资连成一个闭环。模型体验来自数据,数据来自真实任务,真实任务来自产品入口,产品入口又带来更多反馈。2026 的关键不是谁说自己更通用,而是谁能在具体场景里形成数据和产品的复利。
Neo Labs 与 Robotics:新实验室、机器人和真实世界数据
上一章讨论数据闭环,本章看硅谷新实验室和 Robotics。广密提到 SSI、Thinking Machines、Periodic Labs、Aethera、General Intuition、Reflection 等 Neo Labs,也讨论了机器人公司 Pi、Generalist、Sundee、1X、Figure、Google、Tesla 等。这一章的共同关键词仍然是数据:下一范式需要数据,机器人更需要真实世界数据。
图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.88\textwidth]{neo-labs-map.png}
\caption{Neo Labs 分布:自主学习、Post-training、材料模型、多 Agent、世界模型数据和开源模型。自制概念图,依据 00:56:45--00:59:43 对谈内容整理。}
\end{figure}
读图:新实验室不是同一个方向的重复创业
SSI 更像押自主学习;Thinking Machines 被视为 Post-training 与下一范式团队;Periodic Labs 聚焦材料模型;Aethera 探索 Multi-agent 环境;General Intuition 借助游戏高光数据做世界模型;Reflection 被描述为美国开源模型生态的补位。它们共同体现的是:OpenAI 人才溢出后,下一范式被多路线下注。
为什么 OpenAI 分裂后仍然强
本节回到人才组织问题,因为 Neo Labs 的出现不是偶然的创业潮,而是前沿模型公司人才、路线和经验外溢的结果。理解这些团队从哪里来,才能判断它们为什么可能不只是“又一个模型公司”。
节目中有一个很有意思的观察:OpenAI 即使分裂出 Anthropic、Ilya 的 SSI、Mira/John Schulman 等相关团队,仍然很强。Anthropic 被视为 OpenAI 早期 Scaling team 的延伸,SSI 更接近 Pre-training/自主学习方向,Thinking Machines 更接近 ChatGPT 和 Post-training 经验。这说明 OpenAI 的人才密度和范式探索曾经足够集中,以至于外溢后形成多个新中心。
但这也意味着下一阶段不一定由原来的大公司独占。新实验室可能绕过现有模型追赶赛,直接押下一代学习方式、材料科学、多 Agent 环境或世界模型数据。这就是为什么本期既强调 OpenAI 领先,也强调不要只看现有榜单。
Robotics:GPT-0.5 到 GPT-1 的阶段
机器人部分的核心判断是:进步很快,但离 GPT-4 时刻还远。广密认为今天机器人可能处于 GPT-0.5 到 GPT-1,未来两三年可能到 GPT-2/GPT-3。原因在于机器人不像语言模型那样先统一再分化。语言模型有相对统一的 token、文本语料、Transformer 和预训练路径;机器人一开始就是分化的:不同硬件、不同传感器、不同场景、不同采集方式、不同评测目标。
机器人公司现在的分化体现在数据采集上。Google 和 Pi 有遥操作真机数据;Sundee 用手套和背包采家庭数据;Generalist 宣称有大规模真机数据;世界模型和 YouTube/游戏数据也开始进入训练。每条路径都在回答同一个问题:怎样让机器人获得足够多、足够真实、足够高质量的操作数据。
术语消化:机器人数据与泛化
| 术语 | 一句话解释 | 本期关系 |
|---|---|---|
| 遥操作 | 人远程控制机器人完成任务并记录过程 | 提供真实动作轨迹和环境反馈。 |
| 真机数据 | 真实机器人在真实环境中的传感器和动作数据 | 比仿真更贴近落地,但采集昂贵。 |
| 跨本体 | 不同机器人硬件之间共享或迁移能力 | 解决硬件不统一导致的数据碎片化。 |
| 泛化 | 在未见过的新场景中仍能完成任务 | 机器人是否走出自动驾驶式长尾泥潭的关键。 |
| Scaling Law | 数据、模型规模和性能之间的可预测关系 | 如果机器人也出现规模律,产业节奏会更清楚。 |
机器人为什么仍然卡在“场景”
节目中提到,今天机器人主要可见场景仍集中在叠衣服、冲咖啡、家庭任务等演示或早期落地场景。硬件也变得越来越重要,有研究者甚至认为硬件可能占成功因素的很大比例。这提醒我们:机器人不是纯模型问题。它同时是感知、控制、硬件、成本、可靠性、安全、供应链、场景选择和售后运营问题。
机器人不是“把 LLM 接上手脚”
语言模型的成功路径不能直接复制到机器人。机器人要处理物理摩擦、硬件差异、传感器噪声、安全风险、长尾场景和真实世界成本。没有泛化和持续学习,机器人会长期依赖人工采集和场景工程。
本章小结
Neo Labs 和 Robotics 看似分散,其实都围绕下一阶段数据和学习效率展开。新实验室试图找到 Pre-training/RL 之外的新范式,机器人公司试图把真实世界操作变成可学习数据。二者的共同问题是:如何让模型从有限高质量数据中学到可泛化能力。
中美叙事与华人创业者:全球市场、人才红利和风险资本
最后一条主线从技术和产品转向中美叙事。广密认为,美国资本和产业空心化把大量美元、美债和资本动员到 AI 方向;中国则更像把硅谷 0-1 做产业化的后发者,拥有工程、供应链和人才优势,但近几年 0-1 创新氛围和市场化风险资本相对不足。这个判断不必当作宏大结论,适合当作创业者决策框架。
图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{china-founder-operating-model.png}
\caption{华人 AI 创业模型:全球市场、中国人才、风险资本、产品说话与长期目标。自制概念图,依据 01:10:16--01:18:03 对谈内容整理。}
\end{figure}
读图:先看市场,再看身份
图从全球市场开始,因为高付费地区决定收入上限;中国人才和工程能力决定成本与迭代速度;风险资本支持 0 到 1;产品说话意味着淡化身份和地缘标签;长期目标则是出现更多能同时做好中国和全球市场的跨国科技公司。
中美 AI 叙事差异
本节先把宏观叙事拆成资源结构,而不是停在情绪判断。中美差异不只是“谁更乐观”,而是资本、制造、市场、人才和产业化路径的组合不同。
广密对美国的描述是“资本驱动、数据驱动、Token 驱动”,资本追逐塔尖,制造业空心化严重,但如果 AI 成功,美国会非常强。对中国的描述则更像产业化后发优势:很多技术和产品原型可能出自硅谷,但中国公司可以依靠工程、供应链、市场和应用能力后来居上。电动车、智能手机、3D 打印机、运动相机等都被用作类比。
这个类比的隐含问题是:AI 是否也会走同样路径?如果 AI 的核心瓶颈是算力、顶尖研究员和下一范式,那么美国优势更明显;如果核心瓶颈转向工程化、应用、成本、场景和全球化运营,中国团队可能重新获得更大机会。
给华人创业者的三个建议
前面讨论宏观差异,本节转到创业者可执行的选择。对个体团队来说,最重要的不是站队宏大叙事,而是把市场、人才、资本和产品证明顺序排对。
节目中给华人创业者的建议很直接。第一,坚定做全球市场,尤其是高付费能力市场。第二,用好中国工程师和产业优势,不要放弃人才红利。第三,淡化身份和地缘标签,把产品做好,让产品说话。对早期公司来说,能拿什么钱就多拿什么钱,因为跨境信任链、美国一线 VC、身份和地缘因素都会增加难度。
创业者的现实排序
先证明产品价值,再争取资本和叙事改善。身份包装无法替代产品,地缘叙事也无法替代收入、留存、效率和用户真实付费。
为什么希望中国有自己的硅谷
本节从创业者建议再往上走一步,讨论创新生态本身。所谓“中国有自己的硅谷”,在这里不是地理复制,而是希望年轻人、风险资本、算力、研究文化和全球化市场能形成更密的正反馈。
本期结尾的情绪不是民族主义口号,而是对创新生态的担忧。广密回忆中国移动互联网早期的 0-1 创新氛围:移动支付、二维码、直播、微信、O2O 等都曾让中国创业者非常自豪。过去几年,全球 AI 应用独角兽大量出现,但中国团队占比不如互联网时代,这让他觉得可惜。
他认为年轻人的高风险创新需要风险资本支持。人才基础很强,但人才不是唯一要素;还需要资本、算力、创新环境、失败容忍度、全球市场经验和顶尖研究文化。三到五年后最领先 AI 公司是否会由华人团队做出,概率比过去高,但仍取决于这些变量能否补齐。
本章小结
中美叙事的实用价值在于帮助创业者定位资源:美国有资本、前沿研究和高付费市场,中国有工程、人才、供应链和应用能力。华人创业者真正的机会,不在身份叙事里,而在能否把全球市场、中国人才和产品执行力组合起来。
术语消化:本期关键词索引
本期术语密度很高,且许多词在不同语境中含义不同。下面把核心词放在同一张表里,帮助读者复盘。
| 术语 | 一句话解释 | 在本期中的作用 |
|---|---|---|
| AI War | AI 竞争像输不起的军备竞赛 | 替代单纯泡沫叙事,解释巨头和国家持续投入。 |
| AI Bubble | 估值和资本开支是否过热的争论 | 节目开场问题,但不是最终分析框架。 |
| SOTA | State of the art,当前最先进水平 | 被提醒不能只看 benchmark,要看用户和收入。 |
| Benchmark | 用测试集衡量模型能力的榜单或指标 | 有参考价值,但可能被刷分或脱离真实任务。 |
| ARR | Annual Recurring Revenue,年度经常性收入 | 衡量 AI Native 公司商业化速度。 |
| DAU/MAU | 日活/月活用户数 | 比较 ChatGPT 与 Gemini 用户频率和入口心智。 |
| Pre-training | 用海量数据训练基础模型 | 被比作石油,量大但逐渐接近上限。 |
| RL/Post-training | 用反馈、偏好、专家轨迹继续塑形模型 | 被比作新能源,有用但总量和成本受限。 |
| Online Learning | 从持续交互中学习并改进未来行为 | 本期第三范式,也是改变格局的关键变量。 |
| Continuous Learning | 持续学习,常与 Online Learning 近义使用 | 强调模型长期吸收新经验。 |
| Memory | 保存用户、任务和历史上下文的能力 | 是主动 Agent 和 Online Learning 的基础设施之一。 |
| LoRA | Low-Rank Adaptation,用低秩参数高效适配模型 | 节目提到可作为新范式基础设施之一。 |
| MoE | Mixture of Experts,按输入激活部分专家网络 | 用来解释模型激活参数未必无限变大,稀疏度提高。 |
| Agentic Web | Agent 成为入口后重组网页、工具、支付和平台分发 | 影响搜索广告、Super App 和交易抽成。 |
| 模型即产品 | 用户感知的产品体验越来越由模型能力决定 | 说明模型升级会直接改变应用价值。 |
| 数据即模型 | 模型差异最终来自数据分布和反馈闭环 | 说明创业公司必须拥有差异化数据。 |
| 专家蒸馏 | 把高水平专家工作过程变成训练数据 | 横向扩展行业能力的关键。 |
| 局部 L3/L4 | 借自动驾驶分级类比特定场景的高自动化 | 比整体 AGI 更现实的商业落点。 |
| Neo Labs | 从大厂和 OpenAI 溢出的新实验室群体 | 承载下一范式、多 Agent、材料和开源模型探索。 |
| Robotics | 机器人智能与实体执行系统 | 检验泛化、数据和硬件协同的真实世界方向。 |
本章小结
这些术语共同指向同一件事:AI 竞争已经从单点模型能力,扩展为数据、产品、入口、算力、组织、资本和国家战略的复合系统。理解术语之间的关系,比记住某个季度的榜单排名更重要。
总结与延伸
核心结论
最后这一节把全篇从产业叙事重新压缩成可复用判断。读者不需要记住每个公司数字,但应该带走一套判断 AI 竞争的层次图:资本开支、模型范式、入口、数据和创业生态怎样互相约束。
本期的主线可以压缩成九个结论。
- AI Bubble 只能解释估值情绪,AI War 才能解释巨头和国家为什么持续投入。
- OpenAI 的看得见收入来自订阅、广告电商和 API,看不见收入来自 Agent 替代劳动和 AI 做高价值增量任务。
- Nvidia GPU 与 Google TPU 代表开放生态和垂直整合两条硬件/云/模型路线。
- GPT、Claude、Gemini 的交替领先会成为常态,直到下一范式真正拉开差距。
- 基础模型公司像综合电商,Scale Data 的效率很高,创业公司必须找到差异化数据和工作流。
- Google 王者归来不等于危机解除,ChatGPT 也不只是聊天工具;二者都在争夺搜索和个人助理入口。
- Pre-training 像石油,RL 专家数据像新能源,Online Learning 像尚未突破的核聚变。
- “模型即产品,数据即模型”意味着 AI 产品的护城河要回到数据分布、用户反馈和专家过程。
- 华人 AI 创业者的机会来自全球市场、中国人才、工程能力和产品说话,而不是身份包装。
开放问题
这些问题决定 2026 年之后的分叉。
- Online Learning 会在 2026 年出现清晰信号,还是继续停留在研究叙事?
- ChatGPT 融合搜索的速度,会不会快于 Google 自我革新的速度?
- Gemini 的多模态和 Android 生态,能否转化为高频个人助理心智?
- Anthropic 的 Coding 和企业战略 Beta,能否继续抵抗 OpenAI 和 Google 的横向扩张?
- Agentic Web 的支付、授权、人机验证和网站协议,谁会率先标准化?
- Robotics 的数据路线会收敛,还是继续长期分化?
- 中国团队能否在全球 AI 应用独角兽中重新获得互联网时代那样的占比?
拓展阅读
- EP136 全球大模型季报第 9 集:Coding、模型 OS 与硅谷御三家。
- EP134 数据综述:数据金字塔、Recipe、标注与定价。
- EP139 Agent 技术史综述:Agent 的技术谱系和社会辐射。
- EP130 张月光访谈:AI Native 产品、上下文设计和 Agent 产品方法。
- OpenAI、Anthropic、Google DeepMind、SSI、Thinking Machines 相关公开访谈与技术报告:理解下一范式和 Post-training 路线。
最后的判断
EP127 最值得留下的是一个跨层框架:AI 的竞争不是单纯模型榜单,也不是单纯资本泡沫,而是算力、数据、入口、产品、学习范式和国家战略同时变化。未来赢家不一定是某个季度 benchmark 最强的公司,而是能把真实数据、持续学习和用户入口连成闭环的系统。