跳转至

Ep129 9Zsmtuuefmu

LaTeX 源码 · 备用 PDF · 观看视频

导读:上市不是终点,而是一次路线复盘

这期访谈发生在一个特殊节点:智谱确认于 2026 年 1 月 8 日登陆港交所,成为中国首家上市的大模型公司,也被称为“全球大模型第一股”。张鹏带着摔伤的腿、拄着拐杖接受访谈,节目用 “Break a leg” 做开场隐喻。但这期真正重要的,不是上市敲钟的戏剧性,而是智谱六年多如何从清华实验室的认知智能探索,走到大模型产业和上市公司治理。

这份笔记把它整理成三条线。第一条是组织线:清华知识工程实验室的 P2P 传统,怎样变成智谱的成果转化路径。第二条是技术线:从感知智能到认知智能,再被 GPT-3、ChatGPT、DeepSeek 和 Scaling Law 反复冲击。第三条是公司线:一家学院派 AI 公司如何处理开源与闭源、理想主义与商业化、AGI 长期目标与上市公司短期纪律。

本期核心命题

智谱的故事不是“突然赶上大模型风口”,而是长期把研究、工程、产业和商业化放在同一条链路里。上市只是阶段性结果;张鹏更希望智谱在历史里被写成“AGI 的先行者”和“开路的人”。

视觉策略说明

本视频是固定访谈画面,没有 slides、白板或产品演示。正文不重复插入人物帧;封面用于来源识别,正文用成果转化、模型冲击、Scaling Law、开源闭源和公司阶段等概念图承载教学内容。

本章小结

EP129 适合和 EP136 的大模型季报、EP139 的 Agent 技术史一起读。它从一家模型公司的内部视角,解释大模型产业如何被技术范式、资本市场、开源生态和组织治理共同塑形。

吃螃蟹的人:从清华实验室到科技成果转化

访谈开头,张鹏回到智谱的起点。智谱不是凭空创业,而是从清华大学计算机系知识工程实验室的研究和工程转化传统中长出来的。上一代人工智能四小龙让实验室看到 AI 产业化的可能,但也让他们意识到:感知智能阶段的能力天花板明显,下一代人工智能需要新的方向。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{zhipu-ai-roadmap.png}
\caption{智谱六年路线:从认知智能、P2P 转化到上市节点,再回到 AGI 目标。}
\end{figure}

读图:这不是一条纯技术路线

图中每个节点都同时包含技术和组织含义。认知智能是技术方向;P2P 是成果转化机制;GPT-3 和 ChatGPT 是外部范式冲击;DeepSeek 改变开源与效率叙事;IPO 则把公司带入新的治理阶段。

P2P:Paper to Product

前面讲的是智谱的宏观路线,这里进入它最底层的组织方法。P2P 解释了为什么智谱天然会把论文、系统、产品和客户放在同一条链上。

张鹏反复讲到清华的 P2P 传统:paper to project / paper to product。研究成果不能只停在论文和 prototype,而要转成企业客户可用的 system 和 product。他在实验室里负责的正是工程转化:教授和学生做研究,工程团队把研究成果承接成系统,再交付客户需求。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.94\textwidth]{paper-to-product-loop.png}
\caption{P2P:从论文到产品,再通过客户反馈反哺研究。}
\end{figure}

读图:P2P 是智谱的底层组织基因

图中从 Paper 到 Prototype,再到 System、Product 和 Feedback。它说明智谱不是纯学院派研究院,也不是纯销售型公司;它的早期能力来自把前沿研究工程化,再让真实客户的需求反过来修正研究。

科技成果转化的第一只螃蟹

前面讲 P2P 是能力,本节进一步看制度路径。科技成果转化如果没有走通,前沿研究即使能做成系统,也很难变成可以长期融资、经营和上市的公司资产。

2018 年左右国家政策为科研院所人员科技成果转化打开窗口,但细节并不清楚:成果如何估值,学校和团队如何分配,流程如何合规,谁来承担后续责任。智谱团队成了“吃螃蟹的人”:一边和学校谈,一边摸索制度路径,一年多后才把公司注册和团队转出走通。

成果转化不是简单“老师开公司”

高校成果转化涉及知识产权、国资、学校权益、创始团队激励和公司治理。如果制度路径不清楚,后续融资、上市和合规都会留下隐患。智谱选择走正式路径,是公司长期化的重要前提。

制度路径为什么影响技术公司

技术公司常常把注意力放在模型、论文、融资和产品上,但智谱的早期故事提醒我们:制度路径本身也是能力。如果一家从高校或科研院所转化出来的公司,知识产权归属不清、股权分配不清、学校权益不清,短期可能看不出问题,长期到了融资、审计、上市和国际合作时,就会成为结构性风险。

智谱花一年多时间做这个事,看起来慢,但它把未来风险提前消化掉了。这个选择和公司后来的“水泥感”一致:不追求最快的声量,而是把路基铺稳。对 AI 公司来说,这种低调的制度工作不如模型发布吸睛,却决定公司能不能走远。

科技成果转化的四个问题

问题 要解决什么 如果没解决会怎样
成果归属 论文、代码、专利和系统属于谁 融资和上市时产生产权争议。
估值定价 科研成果折算成多少商业价值 股权分配和国资合规难以解释。
团队激励 创始团队和学校如何分配权益 早期贡献者动力不足或后续纠纷。
合规路径 是否符合学校和政策要求 发展越大,历史问题越难补。

本章小结

智谱的早期并不是“模型创业”,而是研究工程化和科技成果转化。P2P 基因解释了它为什么一开始就重视研究、系统、客户和商业化之间的闭环。

认知智能:感知智能之后的下一步

2015--2016 年,上一代 AI 公司主要围绕 CV、早期 NLP 和深度学习落地。张鹏说,当时他们意识到感知智能有天花板:人脸识别超过人以后,再往上提升意义有限,产业效果也接近上限。于是他们提出“认知智能”,作为迈向通用人工智能的下一层台阶。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.94\textwidth]{cognitive-intelligence-ladder.png}
\caption{从感知智能到认知智能,再到大模型、Agent 和 AGI。}
\end{figure}

读图:认知智能是阶段性定义

图中认知智能不是 AGI 本身,而是感知智能之后的 next step。它试图把 AI 从识别、分类、感知任务推进到理解、推理、知识、语言和复杂任务。后来大模型成为承载这个方向的重要技术形态。

为什么不直接定义 AGI

张鹏说,当时他们并不强行定义 AGI,因为太遥远、也定义不清楚;但“下一步是什么”可以尝试定义。这个做法很稳健:不要用终极概念替代阶段性问题。认知智能为智谱提供了一个足够远、但仍能工程化推进的方向。

阶段性目标的价值

长期愿景需要阶段性定义。AGI 是远目标,认知智能是可讨论、可组织资源、可做工程转化的阶段目标。

本章小结

认知智能是智谱早期的方向锚点。它让公司既不止步于感知智能,也不空喊 AGI,而是寻找从理解、推理和知识工程进入下一代 AI 的路线。

GPT-3 与 ChatGPT:外部冲击如何改写公司判断

认知智能给出了内部方向,但大模型浪潮不断从外部改写这条路线。GPT-3 和 ChatGPT 是两个不同层面的冲击:一个改变技术想象,一个改变用户和市场。

访谈章节把 GPT-3 和 ChatGPT 分开,这很重要。GPT-3 代表规模范式进入视野;ChatGPT 代表用户心智和产业节奏被突然点燃。张鹏回忆这些节点时,用的是“既焦虑又兴奋”的语气:焦虑来自外部浪潮太大,兴奋来自自己长期准备的方向终于被验证。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{model-shockwaves.png}
\caption{三次模型冲击:GPT-3、ChatGPT、DeepSeek 及其后续范式变化。}
\end{figure}

读图:每次冲击都改变一个层面

GPT-3 改变技术想象:规模可能带来通用能力。ChatGPT 改变用户心智:普通人知道大模型能做什么。DeepSeek 改变效率与开源叙事:模型能力不只靠砸资源,也可以靠工程和开放生态撬动。

为什么“机会留给有准备的人”

讲完外部冲击后,本节回答一个常见误解:机会来了是不是只靠运气。张鹏的回答更接近日常积累,而不是神奇预测。

张鹏引用导师的话:机会像海上的木板,漂过来时你还得扑腾两下才能抓住。大模型浪潮很难精准预测,但可以长期准备:坚持正确方向,不断积累工程、研究和商业化能力,机会来时才有能力抓住。

准备不是预测

预测是知道明天会发生什么;准备是即使不知道明天发生什么,也持续沿正确方向积累能力。大模型浪潮更像后者。

本章小结

智谱的模型路线不是单纯跟风 GPT-3 或 ChatGPT,而是早期认知智能方向被外部技术范式反复校正。外部冲击越大,越考验组织是否有准备。

Scaling Law 的范式演变

前面讲 GPT 和 ChatGPT 的冲击,这一章进入更底层的技术范式。Scaling Law 一开始像单轴规模问题,后来逐渐变成多轴能力增长问题。

访谈中“Scaling Law 的范式演变”是技术主轴之一。张鹏提到,未来不只是基础模型能力持续提升,还包括多模型、多数据融合、智能体和新的计算方式,尤其 RL 方向会继续产生新方法。也就是说,Scaling Law 不再只等同于“更多参数、更多数据、更多算力”的预训练公式。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{scaling-law-evolution.png}
\caption{Scaling Law 范式演变:规模、多模态、后训练、RL 与 Agent。}
\end{figure}

读图:Scaling Law 正在从单轴变多轴

早期大模型叙事更强调参数、数据和算力;后续则加入多模态数据、后训练、偏好/任务反馈、RL 和 Agent 环境。能力增长不只来自“更大”,也来自“更会用反馈”。

Agent 为什么成为落地路径

张鹏认为智能体很重要,因为它解决模型到实际应用之间的落地路径问题。模型本身是能力底座,但客户要的是业务结果。Agent 把模型和工具、流程、环境、用户需求连接起来,是商业化和能力释放的中间层。

术语消化:Scaling Law 相关

术语 一句话解释 本期中的作用
Scaling Law 模型能力随参数、数据和算力扩展而变化的规律 大模型范式的底层叙事。
Post-training 预训练后用偏好、任务和反馈继续优化模型 让模型更可用、更可控。
RL Reinforcement Learning,强化学习 张鹏认为会带来新的计算方式。
Agent 调用工具并执行任务的智能体 模型连接真实应用的落地路径。
多模型融合 多种模型和数据源共同构成能力系统 基座模型未来方向之一。

本章小结

Scaling Law 的演变说明,大模型竞争不再只是“谁更大”。反馈、后训练、Agent、RL 和多模态数据,正在成为新的能力增长轴。

模型公司分化:智谱的独特下注

访谈里,主持人追问一个很关键的问题:当 OpenAI 越来越像应用公司,Anthropic 在 2B 和 coding 方向很强,Google、Meta、DeepSeek、Kimi、MiniMax、Qwen 等各自形成位置时,智谱的不一样在哪里?张鹏的回答不是一个单点产品,而是三个预测和一个长期下注。

他提到 2025 年初的三个预测:第一,基座模型能力会持续提升,尤其是多模型、多种数据融合的混合型基座模型;第二,智能体会成为重要方向;第三,国际化会变重要。回头看,这三件事都被行业发展验证。未来继续下注的长期词是 AGI,拆到短期则是 Agent 和新的计算方式,尤其 RL。

三类公司分化

分化方向 典型优势 智谱需要回答的问题
应用公司 更懂用户、分发和产品闭环 智谱如何让模型进入真实应用,而不只做 API。
企业/2B 公司 更懂客户、合规、服务和交付 智谱如何把研究能力变成可持续收入。
开源平台 更强生态扩散和开发者反馈 智谱如何把开源影响转化为商业与技术复利。
基础模型公司 更强模型能力和训练体系 智谱如何持续投入并形成差异化能力。

智谱的下注不是一个点

智谱要同时回答模型能力、Agent 落地、国际化、开源生态、商业化和上市治理。它不像单一应用公司,也不像纯开源社区,更像在多个维度上保持平衡的模型公司。

为什么 Agent 是短期抓手

张鹏说,Agent 解决了模型到实际应用之间的落地路径问题。这句话很关键。基础模型本身很强,但客户买单的是工作结果;Agent 把模型、工具、流程和业务场景连接起来,让模型能力能被组织吸收。

从这个角度看,EP129 和 EP130 正好互补。张月光从产品经理角度说 Agent 要有用户心智和短程高频反馈;张鹏从模型公司角度说 Agent 是模型能力进入应用的中间层。二者其实在同一问题的两侧:模型公司要把能力送到产品,产品公司要把能力组织成用户会用的入口。

与 EP130 的连接

EP130 讲 Dokie 从 PPT 切入创作表达 Agent;EP129 讲智谱把 Agent 视为模型落地路径。前者关心用户心智,后者关心模型能力释放。两者合起来,才是 Agent 产业化的完整问题。

本章小结

模型公司已经开始分化。智谱的独特位置,在于它既有学院派研究基因,又必须在上市公司治理下做好商业化、Agent、开源和国际化。

DeepSeek、开源与闭源

前面 Scaling Law 讨论的是能力增长,本章转向能力如何被行业感知和扩散。DeepSeek 把开源、效率和真实效果推到了行业叙事中心。

2025 年章节标题是“向 DeepSeek 学习”。张鹏提到,DeepSeek 某种程度上也教会行业:技术上不需要总靠大发布会,最终还是回归实际应用效果。DeepSeek 同时改变了开源叙事和效率叙事,让模型公司重新思考开放、生态和商业控制之间的关系。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.94\textwidth]{open-vs-closed.png}
\caption{开源 vs 闭源:生态影响和商业控制之间的取舍。}
\end{figure}

读图:开源和闭源不是道德二分

开源能扩大生态、获得开发者反馈、建立技术声誉;闭源能保留商业控制、服务企业客户、处理安全和合规边界。模型公司通常需要在不同产品层和不同客户层做组合。

开源带来的全球反馈

张鹏提到智谱模型开源后,海外评价很高,甚至出现其他产品或公司直接使用、蒸馏、裁剪模型的现象。这既说明开源有影响力,也说明开源会带来被复用、被改造、被重新包装的复杂生态。

开源不是只收获赞美

开源会带来开发者声誉和生态扩散,也会带来商业归属模糊、模型被二次包装、收益难捕捉等问题。开源策略必须和商业化策略一起设计。

本章小结

DeepSeek 之后,模型公司的竞争更加重视效率、真实效果和开源生态。开源与闭源不是二选一,而是模型公司如何分配生态影响、商业价值和安全边界。

从发布会到真实效果:模型公司声量的变化

张鹏在后半段提到一个很微妙的变化:过去模型发布常常需要隆重发布会、几百人现场、强宣发;但 GLM-4.5 开源后,智谱并没有做特别大的发布,海外开发者和产品却给了很高评价,甚至出现 Windsurf 等产品替换或接入模型、其他厂商蒸馏和裁剪模型的现象。这个变化说明,大模型公司的技术声量正在从“发布会叙事”转向“真实使用效果”。

为什么发布会边际收益下降

前面说模型声量转向真实效果,本节解释原因。模型发布太多以后,叙事本身不再稀缺,真实使用和成本效率才更稀缺。

大模型行业经历多轮发布后,用户和开发者对“又一个模型发布”已经审美疲劳。宣传可以带来短期注意力,但模型能否被开发者接入、被客户买单、被社区自发讨论,越来越取决于真实能力和成本效率。DeepSeek 的影响,也在于它把“少说、多开源、效果说话”的路径推到行业前台。

模型声量的三种来源

来源 优点 风险
发布会 叙事集中、容易制造里程碑 用户审美疲劳,难证明长期价值。
Benchmark 可比较、可传播、便于技术判断 容易过拟合榜单,和真实任务有距离。
真实使用 开发者、客户和产品自然反馈 反馈慢、不可控,但最接近商业价值。

被使用也是一种评测

当一个模型被开发者接入,被产品替换原有模型,被其他团队蒸馏或二次包装,它已经不只是 paper 或榜单里的模型,而是进入了实际生态。这里有好处,也有麻烦:好处是模型能力被真实任务验证;麻烦是价值捕获变复杂,开源影响不一定直接变成收入。

真实效果的评测逻辑

模型公司不能只问“我们榜单排第几”,还要问“谁在用,为什么用,替代了谁,成本是否更低,客户是否愿意持续付费”。这才是上市公司阶段更重要的能力证明。

本章小结

模型发布的中心正在从“我说我很强”转向“别人用我做成了什么”。这也是开源生态、商业化和模型能力之间的新关系。

IPO:全球大模型第一股与公司治理新阶段

上市章节不只是资本市场故事。张鹏谈到公司规模门槛:几十人、两百人、五百人、上市公司,对应不同管理问题。几十人时要先挣钱、先建立团队信心;一两百人时开始分工,沟通对齐成本上升;几百人以后出现层级,信息传导变长;上市以后合规和治理要求更高。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{company-stage-thresholds.png}
\caption{创业公司阶段门槛:50 人、200 人、500 人与上市公司治理。}
\end{figure}

读图:数字背后是组织阶段

图中数字不是精确阈值,而是组织复杂度跃迁。团队越大,越不能靠创始人个人视野覆盖所有事,必须依赖机制、委员会、流程、合规和中层管理。

学院派创业的优势与惯性

主持人问“学院派”是否准确。张鹏承认挺对,因为团队从学院里出来。学院派的优势是重视技术、研究和长期问题;惯性则是可能忽视商业化。但智谱早期在实验室里就接触客户、挣钱、做系统交付,因此相对更早学到商业化语言。

学院派创业的关键修正

学院派的技术理想主义必须补上商业化能力。研究、工程、客户、报价、成本和交付,都要进入同一张表。

本章小结

IPO 是智谱的新阶段。它不仅意味着融资和知名度,也意味着治理、合规、信息传导和商业化纪律的复杂度提高。

上市之后:财务纪律、研发投入与商业化平衡

上市以后,模型公司的问题会变得更现实:研发投入很重,商业收入需要增长,资本市场希望看到路径,客户希望看到稳定交付,研究团队又不能失去长期主义。张鹏在访谈里没有给出夸张承诺,而是强调云端收入、2B 收入、成本优化和 break even 的路径会逐步改善。

为什么“只赚钱”不够

上一章讲上市公司阶段的财务纪律,这一节要补上另一半:纪律不能把技术理想压扁成纯利润目标。否则模型公司会失去它的身份。

主持人问,如果智谱未来五年只赚钱、没有技术产出和行业贡献,他是否满意。张鹏的回答是否定的。这句话说明智谱不是把上市当成终点,也不是把利润作为唯一目标。对模型公司来说,利润当然重要,但如果利润来自短期外包、集成或低技术含量交付,而模型能力没有持续前进,公司就会丧失作为大模型公司的身份。

上市公司压力的双刃剑

上市会带来透明度、融资能力和治理规范,也会带来短期财务压力。模型公司若被短期利润完全牵引,可能削弱长期研发;若只讲长期愿景、不证明商业化,也无法支撑持续投入。

商业化如何反哺研究

智谱早期 P2P 逻辑里就有一个闭环:工程实践反哺研究。上市后这个闭环更重要。客户需求能暴露模型真实短板,云端调用能暴露成本和延迟问题,2B 项目能暴露安全、权限、集成和可靠性问题。这些问题如果进入研发队列,会让模型更接近真实世界;如果只被当成售后和交付负担,就会割裂研究和商业。

上市后的正确闭环

研发投入带来模型能力,模型能力带来客户价值,客户价值带来收入和真实反馈,真实反馈再反哺研发。这个闭环比单纯“融资烧钱训模型”更可持续。

本章小结

上市后的智谱要同时证明两件事:它能持续追求 AGI,也能以商业化收入和治理纪律支撑这个追求。二者不是天然对立,但需要非常强的组织平衡。

CEO 作为桥梁:研究、商业化和组织预期

上市前后,CEO 的角色会发生变化。张鹏说,自己现在更多精力放在公司日常运营,尤其是前台、市场化和商业化。他还提到,CEO 很多时候是桥梁,是搭台子的人:让研究部门、技术部门、商业化团队能沟通,让大家发挥想象力、能力和执行力。

研究和商业化不能两张皮

模型公司很容易出现两张皮:研究团队关心模型能力,商业团队关心客户交付。张鹏强调,内部要不断对齐市场变化、技术研发和商业化需求。否则,研究可能做出漂亮但难落地的东西,商业也可能为了短期收入牺牲长期技术方向。

模型公司 CEO 的双重任务

一边要保护长期研究和模型能力,一边要确保客户价值、收入、合规和组织效率。CEO 的核心不是替所有人做决定,而是让这些系统能互相听见。

几个动容瞬间

CEO 的桥梁角色有时很抽象,所以本节用几个具体瞬间把它落地。它们说明模型公司不是只在论文和发布会里证明自己。

访谈最后,张鹏回忆几个瞬间。一个是在深圳为大客户待了小半年,最后不是空手回北京,而是带着几千万合同回去;这说明技术能被客户买单。一个是发布会上用智能体给大家发红包,虽然金额填错一位,但红包发出去了,被评论为 AI 给人类发的第一个红包。还有 GLM-4.5 开源后海外开发者和产品开始使用,甚至出现各种二次使用、蒸馏和包装。

这些瞬间共同说明一件事:模型公司的成就感不只来自 benchmark,也来自客户合同、真实使用、开发者认可和技术回响。

从 benchmark 到真实回响

Benchmark 能证明能力,客户合同证明价值,开源使用证明生态,发布现场证明体验。模型公司要同时管理这几种反馈。

本章小结

张鹏的 CEO 叙事并不“明星化”,更像一个桥梁角色:把研究、工程、商业、客户、治理和团队预期连接起来。这也是智谱“水泥感”的另一面。

理想主义与商业化:开路的人

最后回到价值判断:上市公司要赚钱,但张鹏仍把 AGI 和行业贡献放在更高位置。这里是整期访谈从公司史回到长期理想的地方。

访谈结尾,张鹏被问到做一家实现 AGI 的公司,还是做一家利润很高的公司,二选一选哪个。他选择 AGI,但也强调二者并不对立:如果实现 AGI,也会是一家商业上伟大的公司。更重要的是,他不满意只赚钱而没有技术产出、没有行业贡献的智谱。

图片资源缺失
\begin{figure}[H]
\centering
\includegraphics[width=0.96\textwidth]{idealism-commercialization.png}
\caption{理想主义与商业化:技术理想、工程文化、客户价值、治理和先行者身份。}
\end{figure}

读图:智谱想要的是平衡路线

图中从技术理想到客户价值再到上市治理,最后回到“先行者”。张鹏强调的不是空喊 AGI,也不是只做赚钱机器,而是把“让机器像人类一样思考”变成能服务客户和社会的工程系统。

让机器像人类一样思考

理想主义不能只停在“AGI”这个词上。本节把智谱的 slogan 拆开,看它如何同时指向技术目标和社会价值。

张鹏用公司 slogan 解释智谱对 AGI 的理解:让机器像人类一样思考,并反过来赋能人类社会。这句话可以拆成两部分:第一是技术目标,机器要具备更强理解、推理和行动能力;第二是价值目标,技术要产生实际价值,而不是停在实验室里。

AGI 的可操作化

如果 AGI 定义彼此不同,判断一家公司是否追求 AGI,不能只听口号,而要看它把长期目标拆成哪些阶段任务、技术路线、产品路径和客户价值。

先行者而非只做明星项目

前面讲的是“做什么”,这里讲“希望被怎样记住”。先行者这个词,比明星公司更朴素,也更符合智谱的自我叙事。

节目开头提到,有人评价智谱像“水泥”:能干漂亮的活,但情绪价值不强。张鹏最后说,希望智谱被历史记为 AGI 的先行者、开路的人。这个自我叙事和“水泥”并不冲突:开路的人未必最会制造话题,但要长期铺路、踩坑、转化研究、服务客户、承受组织治理。

本章小结

智谱的自我定位,是在理想主义和商业化之间走平衡路线。上市不是终点,而是让一家追求 AGI 的公司进入更高治理要求下继续前进。

术语消化:本期关键词索引

前面的章节横跨技术、制度、组织和资本市场。这里把关键词集中消化,方便后续和大模型季报、Agent 综述、产品访谈互相索引。

术语 一句话解释 在本期中的作用
认知智能 感知智能之后的理解、推理和知识阶段 智谱早期方向锚点。
P2P Paper to Project / Product 清华成果转化传统。
科技成果转化 把研究成果合规转成公司资产和产品 智谱成立的制度路径。
GPT-3 规模范式的早期外部冲击 改变大模型技术想象。
ChatGPT 大模型用户心智爆发节点 让产业节奏突然加速。
Scaling Law 模型能力随规模和反馈扩展的规律 大模型竞争的底层范式。
Post-training 预训练之后用偏好、任务、工具和反馈继续训练 模型从“会说”走向“可用”的关键阶段。
RL Reinforcement Learning,强化学习 张鹏认为会带来新的计算方式和能力增长轴。
Agent 调用工具并执行任务的智能体 连接模型能力与真实应用。
DeepSeek 代表开源、效率和工程冲击的行业样本 让模型公司重新理解发布和开源。
开源/闭源 生态扩散与商业控制的策略组合 模型公司必须取舍。
Benchmark 用统一任务比较模型能力的评测 有助比较,但不能替代真实使用。
真实使用 开发者、客户和产品对模型的持续采用 上市公司阶段更关键的能力证明。
IPO 上市,进入公开市场和更强合规治理 智谱的新阶段。
先行者 早投入、早铺路、早承担不确定性的人 张鹏希望智谱留下的历史注脚。

本章小结

这些关键词共同描述了一家模型公司的完整链路:从实验室、成果转化、技术范式冲击,到开源生态、商业化、上市治理和长期 AGI 叙事。

总结与延伸

核心结论

  1. 智谱的起点是清华知识工程实验室的 P2P 传统,而不是单纯大模型风口。
  2. 认知智能是智谱早期对“感知智能之后是什么”的阶段性回答。
  3. GPT-3、ChatGPT 和 DeepSeek 分别冲击了技术想象、用户心智和开源效率叙事。
  4. Scaling Law 正在从单纯预训练规模律,扩展到多模态、后训练、RL 和 Agent。
  5. 开源和闭源不是道德二分,而是生态、商业和安全边界的策略组合。
  6. 模型公司的声量正在从发布会叙事转向真实使用效果,开发者和客户的持续采用会越来越重要。
  7. IPO 代表公司进入治理、合规和组织复杂度的新阶段。
  8. 学院派创业的优势是长期技术理想,必须补上商业化和客户价值。
  9. 智谱的自我定位是 AGI 先行者:既要技术产出,也要工程落地和商业化。

开放问题

最后保留开放问题,是因为智谱已经上市,但大模型公司的长期形态仍未收敛。下面这些问题会决定“全球大模型第一股”之后真正的竞争。

  • 上市以后,大模型公司如何在资本市场压力和长期 AGI 投入之间保持平衡?
  • 开源模型的生态影响能否转化为稳定商业价值?
  • Agent 和 RL 会不会成为下一阶段 Scaling Law 的主要增长轴?
  • 中国大模型公司会走向应用公司、2B 公司、开源平台,还是多路线混合?
  • “让机器像人一样思考”如何被转化成可评测、可交付、可监管的阶段目标?

拓展阅读

  • EP136 全球大模型季报:理解模型公司分化、Coding 和模型 OS。
  • EP127 大模型季报跨年对谈:理解 AI War、联盟和 Online Learning。
  • EP139 Agent 技术史:理解 Agent 为什么成为模型落地路径。
  • EP117 模型范式、Infra 和数据史:理解大模型路线的历史脉络。
  • DeepSeek、GLM、Qwen、Kimi 等开源模型报告:比较开源策略与能力演进。

最后的判断

智谱这期访谈最值得带走的,是“先行者”这个词背后的含义:不是最会制造声量的人,而是在制度、技术、工程和商业都不确定的时候,先把路走出来的人。