跳转至

Ep112 6Yexfotusww

LaTeX 源码 · 备用 PDF · 观看视频

导读:这一季的两个关键词

本节先建立整期季报的主线。过去几期《全球大模型季报》更强调智能上限、模型进步和 AGI 主线;这一期开始明显转向产品、入口和商业化。广密给出的两个关键词是“分化”和“产品”。分化指模型公司开始向不同能力区间和产品路线拆开;产品指模型智能必须转化成用户体验、流量、品牌心智和商业化闭环。

这期的核心张力在于:一方面,基础模型前三名还在快速进步,持续吃掉 AI 创业者的机会;另一方面,Magic Moment 的产品窗口仍然存在,只是保鲜期越来越短。创业者面对的是既兴奋又绝望的局面:技术每个月都在变强,但巨头下场也越来越快。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{startup-between-giants.png}
\caption{创业者夹在巨头之间:技术每月进步,但模型公司也不断吃掉机会。自制概念图,依据 00:00:05--00:03:54 对谈内容整理。}
\end{figure}

读图:为什么又兴奋又绝望

兴奋来自技术进步,绝望来自头部模型公司同时做模型和产品。创业者必须抢在巨头产品化之前找到 Magic Window,或者选择巨头难以快速覆盖的垂直场景。

本期核心命题

大模型行业从“智能上限竞赛”进入“智能 + 产品 + 入口 + 商业化”的复合竞赛。模型能力仍然重要,但产品壁垒、默认入口、品牌心智、垂直整合和 L4 体验开始决定谁能把智能变成真实价值。

本章小结

EP112 是模型季报从“模型智能”转向“产品战略”的一集。它不只是列举公司动态,而是在回答:头部模型公司开始产品化之后,创业者和投资人还能在哪里下注。

模型在分化:通用、Coding+Agentic、多模态交互

导读提出“分化”和“产品”两个关键词,本章先展开第一条,核心问题是:头部模型公司不再只沿同一条 benchmark 曲线竞争,而是在能力栈和产品路径上开始分叉。硅谷模型公司这个季度开始显著分化。Google Gemini 和 OpenAI 仍然做通用能力;Anthropic 分化到 Coding 和 Agentic 模型能力;Thinking Machines Lab 分化到多模态和下一代交互;Grok 还在摸索生态位置;Meta 的原创 0-1 基因被认为较弱。最领先的几家公司像 F1 竞赛,速度极快,路线也开始不同。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{model-company-divergence.png}
\caption{模型公司开始分化:Gemini/OpenAI 通用,Anthropic Coding+Agentic,Thinking Machines 多模态交互。自制概念图,依据 00:03:54--00:21:37 对谈内容整理。}
\end{figure}

读图:分化不是掉队,而是选择赛道

通用模型要保持全能力领先;Coding+Agentic 下注高价值工作流;多模态/交互下注下一代入口;生态型公司需要找到与自有平台的结合点。分化说明行业从单纯追 benchmark 进入战略选择。

术语消化:公司路线地图

公司/路线 本期定位 关键风险
Gemini/OpenAI 通用模型和全能力入口 成本高,产品线复杂。
Anthropic Coding + Agentic 能力 需把技术壁垒转成更大产品入口。
Thinking Machines 多模态原生和下一代交互 方向新但商业路径未定。
Grok/xAI 生态位置仍在摸索 平台协同和品牌心智仍需证明。
Meta 开源和社交生态强,但原创 0-1 被质疑 模型路线和产品入口之间不稳定。

分化背后的能力栈

能力栈 代表公司/方向 关键资产
通用智能 Gemini、OpenAI 多模态、推理、搜索、产品入口和算力。
Coding/Agentic Anthropic、Claude Code 代码环境、长程任务、企业开发者心智。
多模态交互 Thinking Machines、Gemini 原生多模态、下一代 interface 和硬件入口。
生态型模型 Grok、Meta 社交平台、开源生态、分发渠道。

模型公司战略对照表

公司/路线 当前强项 需要继续证明
OpenAI ChatGPT 入口、通用能力、产品化 广告/商业化是否不伤用户体验。
Google TPU、搜索、广告、Workspace、Gemini 能否把资产重新组合成默认 AI 入口。
Anthropic Claude Code、企业开发者、Agentic 能力 能否从 coding 扩展到更大工作流。
Thinking Machines 多模态原生、下一代交互想象 能否把研究路线变成强产品。
Meta/xAI 平台、开源、社交或实时数据资产 能否做出原创 0-1 产品心智。

分化给创业者的启发

前面给出公司地图,本节把它翻译成创业者视角。如果头部公司路线开始分化,创业者不能再只问“谁模型最强”,而要问“我站在哪条能力链上”。做 coding 工具,要看 Anthropic/Claude Code;做搜索和研究,要看 Deep Research;做多模态交互,要看 Thinking Machines 和 Gemini;做消费入口,要看 ChatGPT 的全家桶。

不要把分化误读为小公司机会自动变多

分化意味着头部公司开始主动选择战场,不是放弃战场。创业者的机会在于更快、更窄、更深,而不是在巨头已经明确下场的正面战场硬拼。

本章小结

模型公司分化说明行业进入策略期。通用、Coding+Agentic、多模态和生态路线都可能产生赢家,但每条路都要求不同产品、数据和商业能力。

横向全家桶与纵向垂直整合

上一章讲分化,本章讲收敛。C 端有明显头部收敛趋势,ChatGPT 可能收敛掉很多产品。横向全家桶的例子是 ChatGPT,把 Chat、搜索、Coding、Agent、Workspace 都纳入同一入口;纵向垂直整合的例子是 Gemini,从 TPU 芯片、Gemini 模型、Agent 应用,到 Google Docs、Chrome、Android、YouTube,可以形成超级集成。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.94\textwidth]{horizontal-vs-vertical.png}
\caption{横向全家桶 vs 纵向垂直整合:ChatGPT 横向套件,Gemini 纵向超级集成。自制概念图,依据 00:21:37--00:33:35 对谈内容整理。}
\end{figure}

读图:横向和纵向是两种吞噬方式

横向全家桶把多个用户任务聚到一个入口;纵向垂直整合把芯片、模型、应用、浏览器、操作系统和内容生态串起来。前者吃用户心智,后者吃基础设施和默认入口。

ChatGPT 的横向产品壁垒

ChatGPT 不只是一个模型壳,它拥有用户习惯、品牌心智、默认入口、历史对话和持续功能扩展。对于独立 AI 产品,最难的是:你做出的功能如果变成 ChatGPT 全家桶里的一个标签页,用户为什么还要单独使用你?

横向全家桶的杀伤力

横向全家桶最可怕的地方不是单点功能都最好,而是它成为用户默认入口。默认入口可以把“够好”的功能迅速分发给海量用户,从而压缩创业产品的窗口期。

Gemini 的纵向整合

Google 的优势在纵向整合:TPU、云、Gemini、搜索、广告、Docs、Chrome、Android、YouTube 都能协同。广密对 Google 的看法发生转变,原因也在这里:当 AI 产品最终需要搜索、广告、办公、浏览器和操作系统协同,Google 的老资产可能重新变成新优势。

Google 纵向整合的资产

资产 作用 AI 时代价值
TPU/Cloud 算力和训练基础设施 降低模型成本并保证供给。
Search/Ads 入口和商业化系统 AI 搜索和广告平台可能重新融合。
Chrome/Android 浏览器和移动操作系统 Agent 可以进入默认数字环境。
Docs/Workspace 办公场景和用户文件 企业和个人生产力入口。
YouTube 视频内容和多模态数据/场景 多模态理解和生成的应用场。

本章小结

横向全家桶和纵向垂直整合解释了为什么头部公司越来越难绕开。创业者要么成为全家桶里的关键能力,要么找到巨头不容易整合的场景。

智能和产品都重要

本章讨论第二关键词:产品。过去三年行业一直极度上头地探索智能上限,但现在产品重新变得重要。ChatGPT 身上有很多非技术性壁垒,而 Coding 工具或模型公司如果只有技术壁垒,很容易被追赶。OpenAI 的强处在于平衡:一边探索智能上限,一边把智能红利转化成产品流量和品牌心智。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{intelligence-product-balance.png}
\caption{智能和产品都重要:智能上限探索必须转成流量、品牌和用户心智。自制概念图,依据 00:33:35--00:38:52 对谈内容整理。}
\end{figure}

读图:智能不是自动等于产品

模型能力提供可能性,产品体验把可能性变成默认使用,流量和品牌心智让用户持续回来,商业化把智能变成公司能力。缺任何一环,都可能只是技术 demo。

模型壁垒与产品壁垒

上一节强调产品重新变重要,本节拆开两类壁垒。模型壁垒来自 benchmark、coding、agentic、上下文和推理能力;产品壁垒来自用户习惯、品牌、入口、数据回流和商业化。模型壁垒会被追赶,产品壁垒也会被吞并,但二者叠加才形成强公司。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.94\textwidth]{model-vs-product-moat.png}
\caption{模型壁垒 vs 产品壁垒:技术壁垒会被追赶,产品壁垒包含流量、品牌和默认入口。自制概念图,依据 00:33:35--00:38:52 对谈内容整理。}
\end{figure}

不要只看技术壁垒

AI 产品的技术壁垒可能在 3 到 6 个月内被追上。如果没有数据回流、用户习惯、渠道、品牌或工作流沉淀,技术领先很容易变成短暂窗口。

产品壁垒的非技术部分

壁垒 表现 为什么难复制
默认入口 用户每天自然打开 需要长期品牌和使用习惯。
工作流嵌入 产品进入团队流程 替换成本高,数据持续回流。
品牌心智 用户把某类任务默认交给它 首个 Magic Moment 会被长期记住。
商业化 有稳定付费和渠道 不只是模型强,还要懂销售和包装。

本章小结

智能和产品的关系变得更平衡。模型公司需要产品化,产品公司也需要模型理解;单纯技术或单纯产品都不够。

AI 产品像挖矿:Magic Moment 与保鲜窗口

本章解释“挖矿”比喻。第一个做出让用户惊叹体验的产品,会获得巨大营销红利,即使 token 消耗很高也值得。早期搜索问答产品、Cursor、Manus 都属于抓住了某个 Magic Moment 的例子。但窗口期正在缩短:从两年、一年,到几个月。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{ai-product-mining-window.png}
\caption{AI 产品像挖矿:Magic Moment 的保鲜窗口正在缩短。自制概念图,依据 00:38:52--00:44:21 对谈内容整理。}
\end{figure}

读图:挖矿不是长期护城河

挖矿阶段抢的是第一次惊叹和品牌红利;窗口缩短后,模型公司、竞品和开源实现都会迅速跟进。真正护城河要从 Magic Moment 过渡到工作流、数据、入口和品牌。

产品公司能赢过模型公司吗

挖矿窗口的关键问题是:产品公司能不能在模型公司下场前形成壁垒。产品公司有速度、专注和体验优势;模型公司有模型、分发、算力和全家桶优势。产品公司要赢,必须在窗口期内形成强用户心智和数据闭环,否则会被模型公司功能化吸收。

窗口期公式

\[ \text{Startup chance} \approx \text{Magic Moment} \times \text{Speed} \times \text{Moat after copy} \]

其中,Magic Moment 是首次惊叹,Speed 是抢窗口速度,Moat after copy 是被复制后仍然保留的壁垒。

窗口缩短的原因

窗口期缩短有三个原因。第一,基础模型能力更新更快,旧体验很快变成默认能力。第二,头部模型公司有更强分发,能迅速复制成功模式。第三,开源和工具链让工程实现更快,产品领先不能只靠 demo。

创业者策略表

策略 适用场景 风险
抢 Magic Moment 新能力刚出现,用户还没形成默认入口 窗口短,容易被模型公司复制。
垂直深扎 行业工作流复杂,数据和客户关系难迁移 增长慢,销售和交付重。
做工具链 围绕头部模型做开发者/企业工具 平台 API 变化会影响产品。
做入口 抢默认使用场景和品牌心智 与 ChatGPT/Gemini 正面竞争。

本章小结

AI 产品像挖矿,是因为新能力出现时会有短暂高收益窗口。创业者要做的不是只挖第一铲,而是在窗口关闭前形成长期壁垒。

产品窗口案例复盘:从惊叹到默认工具

前一章给出挖矿比喻,本章把它拆成产品生命周期,回答“为什么 Magic Moment 很快不够用”这个问题。AI 产品常见路径是:新模型能力出现,创业者包装出第一个惊叹体验,用户快速传播,模型公司和竞品跟进,最后这个能力变成默认功能。只有在传播之后继续沉淀工作流、数据和品牌,产品才不会被全家桶吸收。

Magic Moment 生命周期

阶段 发生什么 关键动作
发现能力 新模型能力刚刚可用 快速找到最能展示价值的任务。
包装体验 做成用户能感知的 Magic Moment 降低使用门槛,强化传播点。
传播爆发 社交媒体和口碑扩散 抢默认心智和早期品牌。
竞品跟进 模型公司或同类产品复制 补工作流、数据和团队协作。
默认化 能力变成平台基础功能 转向更深场景或成为平台组件。

从惊叹到默认工具的分水岭

惊叹来自“第一次看到它能做”;默认工具来自“每天都离不开它”。AI 产品的难点,是在惊叹窗口结束之前完成这次迁移。

Magic Moment 的副作用

Magic Moment 会让团队误以为产品已经成立,但用户惊叹不等于长期留存。真正危险的是,团队继续围绕演示效果优化,而不是围绕高频任务、协作流程和付费理由优化。

本章小结

AI 产品的生命周期越来越短,创业者必须把产品从惊叹体验推进到默认工具。否则,Magic Moment 只会成为模型公司全家桶里的一个功能。

L4 级别体验:Deep Research 与 Claude Code

前面讨论挖矿窗口,本章看当前最明确的矿脉在哪里。广密认为最优秀的两个 Agent 已经有 L4 体验:ChatGPT 的 Deep Research 和 Anthropic 的 Claude Code,分别对应信息搜索/研究和软件开发。今天最大红利仍然是 language/code 红利,尤其是 code,还不是多模态、世界模型或机器人。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.94\textwidth]{l4-experience-map.png}
\caption{L4 体验地图:Deep Research 和 Claude Code 分别代表搜索和软件开发。自制概念图,依据 00:44:21--00:52:43 对谈内容整理。}
\end{figure}

读图:为什么这两个像 L4

Deep Research 能完成多步信息搜索、综合和报告;Claude Code 能理解代码库、修改、测试并迭代。这些任务都有明确输入、工具环境和可验证输出,因此更容易形成高阶 Agent 体验。

为什么 code 红利最大

代码世界有天然优势:任务可形式化、工具可调用、结果可测试、反馈快、价值高。相比多模态、机器人和世界模型,coding 更早出现 L4 体验并不意外。它是数字世界里最适合 Agent 的高价值环境之一。

L4 体验条件

条件 Deep Research Claude Code
任务清晰 研究问题和资料收集 issue、bug、feature。
工具可用 搜索、网页、引用 代码库、测试、shell。
结果可评估 报告质量和来源 测试通过、代码 review。
价值高 节省研究时间 节省工程时间。

下一批 L4 候选场景

场景 为什么可能出现 L4 难点
法律/合规 文档密集、流程明确、价值高 责任重,错误成本高。
金融研究 信息检索、模型、报告和交易线索 数据授权和实时性要求高。
销售运营 CRM、邮件、会议、报价都可工具化 私有数据和组织流程复杂。
数据分析 SQL、报表、BI、业务解释闭环 需要理解指标口径和业务语义。
设计/多模态 视觉生成和编辑迭代变快 主观评价和版权问题更复杂。

本章小结

L4 体验不是抽象等级,而是用户真的愿意把复杂任务交给系统。Deep Research 和 Claude Code 是目前最清晰的两个样本。

重新评价 Google:广告、搜索与全家桶汇合

上一章讲当前 L4 体验,本章回到平台级竞争,尤其是 Google 的再评价。一个猜想是 ChatGPT 后面会做广告平台,因为最近招了新的商业化 CEO;但 Google 仍然是全球最好的广告平台。最后大家产品形态可能殊途同归:Search 演变,广告、AI、全家桶和操作系统逐渐融合。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{google-revaluation.png}
\caption{重新评价 Google:广告、搜索、Gemini、TPU 和全家桶逻辑会重新汇合。自制概念图,依据 00:52:43--00:55:53 对谈内容整理。}
\end{figure}

读图:Google 的旧资产可能变新优势

AI 搜索需要商业化,广告需要新入口,Gemini 需要产品分发,TPU/Cloud 需要模型需求。Google 的资产如果重新组合,会形成纵向整合优势。

平台路线对照

平台路线 核心打法 可能结果
OpenAI/ChatGPT 横向整合用户任务,形成 AI 默认入口 吃掉大量独立应用的轻量场景。
Google/Gemini 纵向整合算力、搜索、广告、办公和 OS 旧互联网资产被 AI 重新激活。
Anthropic/Claude 在 Coding 和 Agentic 体验上形成技术心智 高价值开发者/企业场景领先。
垂直创业公司 在巨头不够深的场景里抢窗口 需要快速形成数据和工作流壁垒。

本章小结

Google 的故事提醒我们,AI 不会简单替代旧互联网资产。搜索、广告、浏览器、办公和操作系统都可能被 AI 重新整合。

泡沫、华人 AGI 与全球叙事

前面都是公司和产品分析,最后一章处理外层变量:资本、泡沫和全球叙事。AGI 是否有泡沫,泡沫破裂的导火索是什么,人类和大猩猩智能差异在哪里,湾区新话题,以及“犹太人的金融,华人的 AGI”。这些话题看似分散,其实都在讨论 AI 的社会叙事和资本预期。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{agi-bubble-dashboard.png}
\caption{AGI Bubble 仪表盘:泡沫是否破裂取决于收入、模型进步、CapEx 和产品兑现。自制概念图,依据 00:55:53--01:09:11 对谈内容整理。}
\end{figure}

读图:泡沫不只看情绪

判断 AGI 泡沫,要看模型是否继续进步、收入是否兑现、CapEx 是否有回报、L4 产品是否继续出现、估值是否过度透支。情绪会波动,但基本面要看这些指标。

泡沫触发器表

触发器 可能信号 为什么危险
模型进步放缓 新模型提升有限,成本更高 估值建立在持续能力跃迁上。
收入不及预期 订阅、API、企业收入低于 CapEx 资本开支难以被现金流解释。
产品窗口关闭 L4 体验迟迟不扩展 用户增长和付费意愿下降。
硬件/能源约束 GPU、数据中心、电力成本上升 训练和推理成本压缩利润。
监管/版权风险 数据和生成结果被限制 数据和产品供给受影响。

华人的 AGI

“犹太人的金融,华人的 AGI”是一句带有叙事色彩的总结。它指向一个事实:全球 AGI 竞赛中,华人团队在模型、应用、工程和创业中都非常活跃。但挑战也明显:全球化品牌、资本市场、算力供应、企业销售和合规都不是纯技术问题。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.94\textwidth]{chinese-agi-global.png}
\caption{华人的 AGI:全球 AGI 竞赛中,华人团队的技术、产品和商业能力被重新定价。自制概念图,依据 00:55:53--01:09:11 对谈内容整理。}
\end{figure}

叙事不能替代能力

“华人的 AGI”可以是鼓舞性的叙事,但不能替代模型能力、产品能力、组织能力和全球商业能力。真正的全球公司需要同时解决技术、产品、资本、品牌和合规。

本章小结

泡沫和全球叙事是 AI 周期的外层变量。模型进步和产品体验决定底层,资本和叙事决定波动,创业者必须同时看两层。

总结与延伸

本节把 EP112 压缩成五个结论。第一,模型公司开始分化,通用、Coding+Agentic、多模态交互和生态定位成为不同路线。第二,C 端入口出现收敛,ChatGPT 横向全家桶和 Gemini 纵向整合代表两种吞噬方式。第三,智能和产品都重要,产品壁垒开始重新被定价。第四,AI 产品像挖矿,Magic Moment 的窗口越来越短。第五,L4 体验已经在 Deep Research 和 Claude Code 上出现,当前最大红利仍是 language/code。

把 EP112 放进张小珺 AI 队列

EP127、EP136 是更宏观的大模型季报,EP115/EP113 讲 Agent 和 K2 技术路线,EP112 则把视角拉回产品和市场:模型公司如何分化,AI 产品如何抢窗口,Google/OpenAI/Anthropic 的平台路线如何收敛。

关键 takeaways

前面章节分别讨论公司分化、平台收敛、产品窗口和泡沫叙事,本节把它们压缩成可操作判断。对投资人来说,关键不是追每一个新模型发布,而是判断能力是否转化成入口和收入;对创业者来说,关键不是证明模型能做,而是证明自己能在窗口期后仍然留住用户。

本期判断清单

判断 含义 观察指标
模型公司分化 不同公司选择不同能力栈 coding、agentic、多模态和通用榜单。
产品重新重要 智能要变成入口和心智 DAU、留存、付费、品牌默认选择。
窗口缩短 Magic Moment 更快被复制 竞品跟进速度、模型原生功能吸收。
Google 被重估 旧资产可能在 AI 中重新组合 Search、Ads、Gemini、Workspace 集成。
泡沫要看兑现 情绪不是唯一标准 收入、CapEx、模型进步和 L4 产品。

投资/创业决策框架

问题 投资人看什么 创业者要回答什么
能力是否稀缺 模型公司多久会追上? 我的体验窗口有多长?
入口是否明确 用户是否高频打开? 我是否能成为默认工作流?
数据是否回流 使用越多是否越强? 我能否积累专有数据或偏好?
商业是否闭环 收入能否覆盖推理成本? 我如何从 Magic Moment 变成付费理由?
巨头是否会做 全家桶是否天然包含它? 我能否避开或借力平台?
  1. 模型公司分化不是弱化,而是路线选择:通用、Coding+Agentic、多模态交互都在争夺不同高地。
  2. 横向全家桶和纵向垂直整合,会持续压缩独立 AI 产品的生存空间。
  3. 产品壁垒包括默认入口、品牌心智、数据回流和商业化,不只是模型能力。
  4. AI 产品的 Magic Window 正在缩短,创业者必须快速把惊叹转成壁垒。
  5. 当前最清晰的 L4 体验仍在 language/code,而不是多模态、世界模型或机器人。

开放问题

  1. 下一个 L4 体验会出现在法律、金融、销售、数据分析还是企业 workflow?
  2. Google 的纵向整合能否抵消 ChatGPT 的横向入口优势?
  3. 产品公司如何在 3 到 6 个月的 Magic Window 里形成持久壁垒?
  4. 如果 AGI 出现泡沫,最可能的破裂点是模型进步放缓、收入不及预期,还是 CapEx 回报不足?
  5. 模型公司产品化以后,独立应用公司最适合留在哪些层:入口、工具链、垂直工作流,还是数据网络?
  6. 当搜索、广告、办公和 Agent 融合时,Google 与 OpenAI 的竞争会更像搜索战,还是操作系统战?

季报判断的时效性

季度判断天然会过期。真正值得保留的不是某家公司一时领先,而是判断框架:分化、收敛、产品窗口、L4 体验、平台整合和泡沫指标。这些框架可以继续用来观察下一季。

拓展阅读

  • 对 Agent 技术路线感兴趣,可对照 EP115 姚顺雨访谈和 EP113 杨植麟 K2 访谈。
  • 对企业落地感兴趣,可对照 EP116 吴明辉访谈,理解 Agentic Model 在 ToB 私有数据中的形态。
  • 对更宏观的大模型季报感兴趣,可继续对照 EP127 和 EP136 的季度报告笔记。