Notes from inside China's AI labs — 中国 AI 实验室内部笔记
| 字段 | 内容 |
|---|---|
| 作者/整理 | 原文:Nathan Lambert / Interconnects AI;中文编译、背景与解读:AI Course Notes |
| 来源 | Nathan Lambert, Interconnects AI |
| 日期 | 2026-05-07 |
导读:为什么这篇文章值得完整读
Nathan Lambert 的这篇文章写于一次中国 AI 实验室访问之后。它的表层主题是“中国 AI 实验室见闻”,更深层主题则是:当大模型竞争进入系统工程、组织工程和产业生态竞争阶段,中美 AI 实验室到底在哪里相似,又在哪里不同?
这篇文章很适合中文读者完整阅读,因为它不是外部观察者用二手材料拼出的中国 AI 产业报告,而是一个长期关注开放模型、训练方法和美国 AI 生态的人,在与中国研究者面对面交流之后形成的现场笔记。作者的许多判断未必都完全正确,但它们非常有启发性:他既看到中国实验室的工程优势,也承认自己对中国了解有限;既希望美国保持 AI 领导力,也担心美国若放弃开放模型生态,会把全球开发者重心推向中国模型。
本讲义的组织方式
本讲义采用“译文式编译 + 背景资料 + 解读”结构。前半部分按原文顺序忠实转述作者观点,尽量保留论证节奏和语气;后半部分补充中国 AI 实验室、模型生态、开源/开放权重、算力和数据产业背景,并给出阅读框架。为尊重原文版权,正文不是逐句全文复刻,而是面向学习用途的中文编译与分析。
一页速读
- 作者的核心观察:中国 AI 实验室和美国实验室在技术目标上相似,但组织文化、人才结构和产业动机不同。
- 研究者气质:作者感受到中国研究者更工程化、更谦逊、更少个人明星政治,更愿意做非耀眼但有用的工作。
- 人才结构:中国实验室大量吸收学生和年轻研究者进入核心 LLM 工作,这让团队更适应快速变化的 MoE、RL、agent 范式。
- 产业逻辑:中国公司有更强的 technology ownership mentality,美团、小米、蚂蚁等业务公司自建模型,是为了控制未来技术栈。
- 开放策略:中国实验室并非纯粹 open-source idealists,开放权重更多是务实选择:获得反馈、建立生态、扩大影响力。
- 关键约束:Nvidia 训练算力仍是瓶颈;数据和 RL environment 产业不如美国成熟,迫使团队更多自建。
- 最大问题:中国模型会长期是美国前沿的 3--9 个月 fast follower,还是会从不同生态中长出真正不同的模型路线?
读法提醒
本文不是统计研究,也不是官方产业白皮书,而是一次密集访问后的观察性文章。它最有价值的部分不是结论本身,而是提供了一组可检验的假设:组织文化是否影响模型质量?开放权重是否正在改变全球开发者生态?中国企业 AI 支出到底像 SaaS 还是像 cloud?
本章小结
这篇文章值得按“原文主线”来读:先理解作者如何描述中国研究者,再理解他如何描述产业差异,最后再讨论全球开放模型生态和中美 AI 均衡。
中文编译(一):旅程开场与总体感受
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者从杭州到上海的高铁上写下开场:窗外是山脊、风机、田野和高楼混杂的景象。他说自己带着很大的谦逊离开中国。到一个陌生地方却被热情接待,是一种非常温暖、非常有人味的体验。他见到了许多过去只在远处知道的 AI 生态参与者,而这些人用笑容和善意欢迎他,让他重新意识到:自己的工作和 AI 生态本身都是全球性的。
\end{translationbox}
这个开场很重要。作者不是从 benchmark、芯片制裁或地缘政治开始,而是从人的温度开始。后文虽然讨论技术和产业竞争,但语气并不冷冰冰。他把中国研究者写成具体的人:谦逊、专注、热情、有执行力。这种写法本身就在反抗一种常见叙事:把中国 AI 实验室只当作美国政策、芯片限制或产业竞争中的抽象对象。
为什么开场的“人味”重要
AI 产业讨论很容易被压缩成国家、公司、模型榜单和政策。作者的开场提醒读者:前沿 AI 竞争背后是具体研究者、学生、工程师和团队的日常工作。理解这些人的动机和组织环境,往往比只看参数量和 benchmark 更接近真实。
本章小结
文章一开始就奠定了语气:这不是一篇冷战式中国 AI 分析,而是一篇带着尊重、好奇和不确定性的现场笔记。
中文编译(二):中国研究者的心态
中国实验室为何适合 fast-following
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者认为,中国的语言模型公司非常适合成为这项技术的 fast follower。这种适合并不只是因为资源或政策,而是因为长期教育和工作文化、以及略有不同的科技公司建设方式。若只看输出结果,中国和美国实验室都在做最大的模型、agentic workflows、大规模数据和加速计算;但真正持久的差异,出现在这些要素如何被组织、如何被条件塑造。
\end{translationbox}
这里的 fast follower 不是贬义。作者的意思是:当一个技术路线已经被证明可行,下一步竞争就变成谁能更快吸收、复现、工程化、扩展和降本。LLM 的很多阶段正是这样:MoE scaling、RL scaling、agent tool use、long-context、coding agent 等方向一旦出现可行路径,系统工程能力就非常关键。
fast follower 的真实含义
fast follower 不是“只会抄”。在复杂技术产业中,fast-following 需要极强的吸收能力、工程能力、组织协调和成本优化能力。很多时候,最先提出方向的实验室不一定是最能规模化落地的实验室。
LLM 建设是一场全栈细节战
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者说,今天要构建最好的 LLM,很大程度上取决于整个 stack 的细致工作:从数据,到架构细节,再到 RL 算法实现。模型每个部分都可能带来一点改进,而把这些改进组合起来,是一个复杂的多目标优化过程。有时,一些聪明个人的工作必须被搁置,因为最终目标不是让每个 idea 都进入模型,而是让整体模型最好。
\end{translationbox}
这段是全文的技术前提。大模型不是一个单点发明,而是由数据、训练、推理、评测、RL、产品反馈、infra 共同决定的复杂系统。谁能把大量小改进协调起来,谁就可能在最终模型上获胜。
多目标优化的组织含义
模型训练中的 multi-objective optimization 不只是数学问题,也是组织问题。研究者可能各自优化不同指标:数学、代码、对话、工具调用、安全、成本、延迟、中文能力。最终版本必须在这些目标之间取舍,因此组织需要能处理“好 idea 未被采用”带来的心理和政治成本。
个人明星文化与组织政治
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者对比美国实验室说,美国研究者当然也非常聪明,但美国文化更鼓励为自己发声。作为科学家,越能为自己的工作争取可见度,越容易成功;现代 AI 文化也制造了``明星 AI 科学家''这条成名路径。这会带来直接冲突。作者提到一些美国实验室里围绕最终模型采纳哪些 idea 的内部政治传闻。无论传闻细节是否准确,他想表达的是:ego 和职业晋升欲望确实可能妨碍做出最好的模型。中美之间哪怕只有小幅文化差异,也可能影响最终输出。
\end{translationbox}
这段会有争议,因为它容易被读成“美国人自我、中国人谦逊”的粗糙二分。但更准确的读法是:作者在讨论科研信用分配机制如何影响模型组织。前沿 LLM 团队越大,越需要在个人 credit 和整体产品之间建立平衡。
不要把文化差异绝对化
作者说的是倾向,不是铁律。美国也有极强工程协作,中国也有组织政治和个人竞争。真正值得关注的是:当模型训练变成大规模团队工程时,credit、晋升、论文、内部话语权这些激励机制如何影响最终模型。
学生和年轻研究者直接进入核心团队
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者认为,中国实验室的一个现实是:核心贡献者中有很大比例是活跃学生。这些实验室很年轻,学生被视为同伴,直接整合进 LLM 团队。这让作者想到 Ai2 的做法。相比之下,美国顶级实验室如 OpenAI、Anthropic、Cursor 等基本不提供这种核心模型实习机会;Google 虽然有 Gemini 相关实习,但学生会担心自己被放在隔离任务上,接触不到真实核心工作。
\end{translationbox}
这点对中文读者尤其重要。很多中国模型团队和高校、实验室、学生圈之间联系紧密,年轻人可以非常早地进入前沿工程现场。这既是机会,也是学术系统的挑战。
作者总结这种文化差异对模型建设的帮助:
- 更愿意做不耀眼但能改进最终模型的工作;
- 新人不被上一轮 AI hype cycle 绑定,能更快接受现代技术路线;
- ego 较少,组织层级更容易扩展;
- 大量人才适合解决那些已有 proof of concept、需要快速工程化的问题。
学生优势
过去几年,LLM 核心范式从 MoE scaling,到 RL scaling,再到 agent capabilities 快速移动。学生和年轻研究者习惯短期吸收大量上下文,也更愿意放下原有先验。这种“新鲜眼光 + 高强度投入”,在快速变化阶段特别有价值。
0-to-1 原创性的疑问
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者同时指出,这种适合今天 LLM 建设的能力,与一个常见刻板印象形成对照:很多人认为中国研究者较少产生开创新领域的 0-to-1 学术研究。访问中,一些更学术化实验室的领导者谈到要培养更有雄心的研究文化;但也有技术领导者怀疑,这种科研方式的重塑短期内是否可能,因为它需要教育和激励系统的重设计。作者的判断是:中国文化正在训练一批非常适合 LLM building game 的学生和工程师,而且数量极其充足。
\end{translationbox}
这段非常关键:作者不是无条件称赞中国 AI。他承认中国团队很适合现在这场游戏,但对是否能长期产生新范式保持疑问。换句话说,中国的优势可能是工程化和追赶,而不一定自动转化为范式定义权。
学术人才流向产业
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
中国学生也告诉作者,中国正在发生与美国类似的 academic brain drain。许多原本考虑学术道路的人,现在打算留在产业界。作者提到一个有趣说法:某位研究者本来想当教授,因为想接近教育系统;但后来开玩笑说,LLM 已经把教育解决了,``学生为什么还要跟我说话?''
\end{translationbox}
这个玩笑背后其实很尖锐:如果最好的学生都进入模型公司,大学如何保留基础研究?如果教育本身也被 LLM 改造,教授的角色会怎样变化?作者没有展开,但这是一条很重要的延伸线。
少谈哲学,多做模型
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者发现,中国学生和研究者很直接,较少被一些哲学讨论分散注意力。当他询问模型的经济影响、长期社会风险等问题时,很多中国研究者没有复杂观点,也没有强烈愿望去影响这些议题。他们的角色是做出最好的模型。作者说,这种差异很微妙,也容易被否认,但在长谈中可以感受到:一些研究者英文表达很好、非常优雅聪明,但当问题转向 AI 的宏观哲学面向时,他们会表现出一种简单的困惑,仿佛这是类别错误。
\end{translationbox}
这里作者不是说中国研究者不关心社会,而是说他们对自己的角色边界更明确:不知道的事不乱讲,不把宏大议题当作个人品牌经营的一部分。
类别错误
“类别错误”指把一个问题放错了范畴。对某些中国研究者来说,问一个训练模型的工程师“AGI 后经济秩序会怎样”,可能就像问机械工程师“现代性的道德基础是什么”:不是完全无关,但不是他当下工作的类型。
北京的密集 AI 生态
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者从更大尺度看北京,觉得它很像 Bay Area:一个有竞争力的实验室可能就在短距离交通范围内。他一下飞机就顺路去了阿里北京园区,接着在 36 小时内拜访了 Z.ai、Moonshot AI、清华、美团、小米和 01.ai。用滴滴出行很方便,叫 XL 车型时还常常遇到带按摩椅的电动小型 van。谈到人才战时,研究者说情况和美国类似:研究者跳槽很正常,去哪儿很大程度取决于当下哪里的氛围最好。
\end{translationbox}
这段给了一个空间想象:中国 AI 不是分散在抽象政策文件中的产业,而是一个高度密集的人才网络。北京、杭州、上海、深圳等城市的实验室、公司和高校形成了真实的流动网络。
生态而非部落
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者说,在中国,LLM 社区给他的感觉更像一个 ecosystem,而不是互相开战的 tribes。许多 off-the-record 对话中,人们对同行充满尊重。中国实验室都忌惮字节跳动及其流行的 Doubao 模型,作者称它是中国唯一的 frontier closed lab。同时,大家也非常尊重 DeepSeek,把它看作执行品味最好的研究实验室。相比之下,作者觉得在美国与实验室成员私下交流时,火花和冲突很快就会冒出来。
\end{translationbox}
作者眼中的中国 AI 圈
中国 LLM 圈不是没有竞争,而是竞争表达方式不同:强者会被尊重,同行会互相观察和学习,整体更像生态系统;美国圈则更容易被公司阵营、个人品牌、资金和意识形态标签撕裂。
研究者与商业问题的距离
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者认为,中国研究者最突出的谦逊之一,是他们在商业问题上经常耸耸肩,说那不是自己的问题。而美国几乎每个人都在关注生态级产业趋势:数据供应商、算力、融资、商业模式等等。
\end{translationbox}
这并不意味着中国公司没有商业战略,而是研究者的角色边界更清楚。美国前沿 AI 公司由于融资、估值、叙事、政策和产品高度耦合,研究者也更容易被卷入宏观讨论。
本章小结
作者在第一大部分讲的是人和组织:他认为中国研究者的谦逊、工程化、学生参与和生态尊重,使中国实验室非常适合当前 LLM 这场系统工程竞赛。但他也留下疑问:这种文化是否能孕育更多 0-to-1 原创研究?
中文编译(三):中国 AI 产业与西方实验室的差异
AI 模型公司已经不只是研究团队
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者说,今天构建 AI 模型最有趣的地方在于,它不再只是把一群优秀研究者聚在一栋楼里,做出一个工程奇迹。过去也许可以这样理解,但要维持 AI business,LLM 正变成构建、部署、融资和采用的混合体。领先 AI 公司存在于复杂生态中,需要资金、算力、数据等持续输入,才能继续推动前沿。
\end{translationbox}
这段把讨论从“研究者心态”转向“产业系统”。OpenAI、Anthropic 这样的公司已经是资本、云基础设施、数据供应链、企业市场、消费产品和政策讨论的交汇点。中国实验室也面对相同问题,但它们的解法不同。
国内 AI 需求的早期信号
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者提到一个常见假设:中国 AI 市场会更小,因为中国公司通常不愿意为软件付费,因此无法形成支撑实验室的大规模推理市场。作者认为,这个说法只适用于映射到 SaaS 生态的软件支出;而中国同时显然有很大的云市场。关键问题是:企业 AI 支出到底会像 SaaS 一样很小,还是像 cloud 一样成为基础设施?中国实验室内部也在争论这个问题。作者的总体感受是,AI 更像 cloud,而且没有人特别担心围绕新工具的市场不会成长。
\end{translationbox}
SaaS 逻辑 vs. Cloud 逻辑
如果 AI 是 SaaS,中国市场可能受制于企业软件付费传统;如果 AI 是 cloud,它就是生产力基础设施,企业会为算力、推理、自动化和业务能力付费。作者倾向于认为 AI 更接近后者。
这点对判断中国模型公司收入很重要。很多外部分析会说:中国企业不买软件,所以中国大模型 API 赚不到钱。但如果 AI 能力被嵌入云、办公、客服、研发、推荐、营销、设备和本地生活系统,它未必走传统 SaaS 路径。
中国开发者深受 Claude 影响
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者发现,中国许多 AI 开发者都非常迷 Claude,认为 Claude 改变了他们构建软件的方式,尽管 Claude 名义上在中国不可用。作者说,中国过去不太愿意购买软件这一事实,并没有让他觉得中国不会出现大规模推理需求。中国技术人员非常务实、谦逊、有动力,这种力量似乎强于过去不买软件的习惯。也有研究者提到用自己的工具,例如 Kimi 或 GLM CLI,但几乎所有人都会提到 Claude。相比之下,Codex 被提到的次数少得惊人,而 Codex 在 Bay Area 正明显变得流行。
\end{translationbox}
这段有两个信息:第一,中国开发者会绕过可访问性障碍使用最有效工具;第二,coding agent 的真实需求可能比官方市场数据更早出现。
为什么 Claude 是需求信号
开发者自发使用 Claude,说明 coding assistant / coding agent 已经从玩具变成生产工具。即使官方渠道受限,强需求也会通过替代路径出现。对模型公司来说,这意味着未来推理需求不只来自聊天机器人,而来自软件开发工作流本身。
中国公司的技术所有权心态
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者说,中国文化和强劲经济引擎结合,产生了很难预测的结果。他留下的持久印象是,众多 AI 模型并不是某个总体规划的结果,而是许多科技公司在当前均衡下的务实选择。行业尊重字节和阿里这样的 incumbent,认为它们拥有资源,可能赢下很多市场。DeepSeek 是受尊重的技术领导者,但远不是市场领导者;它设定方向,却不一定具备经济上最终取胜的结构。
\end{translationbox}
这段是全文产业判断的中心:中国模型多,不是因为所有公司都盲目追热点,而是因为很多公司认为必须掌握这项底层技术。
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
这解释了为什么像美团或蚂蚁这样的公司也在构建模型。西方观察者可能会惊讶:为什么这些公司要做 LLM?但在中国语境下,它们显然认为 LLM 将成为未来技术产品的核心,因此需要一个强底座。当它们 fine-tune 强通用模型时,开放社区的反馈会让它们的 stack 更坚固,同时它们也可以保留内部 fine-tuned 版本用于自己的产品。行业里的 open-first mentality 很大程度上由实用主义定义:它帮助模型获得反馈,回馈开源社区,也增强公司使命。
\end{translationbox}
open-first 的实用主义
开放权重不一定来自纯粹开源理想主义。对很多中国公司而言,开放是一个产品和研发策略:让社区测试模型、扩大开发者生态、建立技术声誉,同时把真正业务相关的 fine-tuned 版本留在内部。
政府帮助真实存在,但难以量化
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者说,外界经常断言中国政府正在积极帮助开放 LLM 竞赛。政府确实是多层级、分散的,每一层并没有清晰剧本。北京不同街区会竞争吸引科技公司办公。政府提供的``帮助''几乎肯定包括减少许可证等官僚摩擦,但还能走多远?能否帮助吸引人才?能否帮助走私芯片?访问中,作者听到许多关于政府兴趣或帮助的提法,但细节太少,不足以形成确定叙事。至少,他没有看到中国最高层影响任何模型技术决策的迹象。
\end{translationbox}
这段很重要,因为它同时反对两个极端:一是认为中国 AI 全靠政府指挥;二是认为政府因素完全不存在。作者看到的是一种更复杂的地方政府、产业园区、政策兴趣和资源协调网络。
不要把政府想象成单一 actor
中国政府支持 AI,可能表现为地方招商、审批便利、算力资源协调、人才政策和产业基金,但这不等于中央直接决定模型架构、RL recipe 或开源策略。产业政策影响路径往往比外部叙事复杂。
数据产业不如美国成熟
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者此前听说 Anthropic 或 OpenAI 可能为单个环境支付 1000 万美元以上,每年为推动 RL 前沿的数据和环境花费数亿美元。因此他很想知道,中国实验室是否购买同样的美国环境,或者是否有镜像的国内数据生态。答案不是完全没有数据产业,而是中国实验室的经验是:数据产业质量相对较差,很多时候自己构建环境或数据更好。研究者自己会花大量时间制作 RL training environments,一些大公司如字节和阿里有内部数据标注团队。这与前面提到的 build-not-buy 心态一致。
\end{translationbox}
RL environment 是什么
在 agentic RL 中,环境不是一堆静态文本,而是模型可以交互、尝试、失败、得到反馈的任务世界。例如 coding benchmark、网页操作、工具调用、数学证明、企业工作流模拟等。高质量环境越接近真实任务,越能训练出可用 agent。
这里有一个有趣反转:美国有更成熟的外部供应链,中国供应链弱,因此中国团队被迫自建。短期看这是成本,长期看可能形成内部能力。
对 Nvidia 芯片的渴望
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者说,Nvidia 计算仍然是训练黄金标准,每个人的进展都受限于没有更多 Nvidia 芯片。如果供应存在,中国实验室显然会购买。其他加速器,包括但不限于华为,在推理方面被积极评价;许多实验室都能接触华为芯片。
\end{translationbox}
推理替代不等于训练替代
国产或替代加速器可以在 inference 中发挥越来越大作用,但前沿训练对集群稳定性、通信、kernel、调试、框架生态和工程经验要求极高。Nvidia 仍然是训练前沿模型的事实标准。
中国生态是否会产生不同模型
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者总结说,这些点描绘了一个非常不同的 AI 生态。如果把西方实验室的运作方式快速映射到中国同行身上,常常会犯类别错误。关键问题是:这些不同生态会不会生产出有意义地不同的模型?还是说,中国模型永远会被解释为类似美国前沿模型 3--9 个月前的版本?
\end{translationbox}
本章小结
第二大部分讲的是产业:AI 公司需要资金、算力、数据、部署和采用;中国公司的差异在于更强控栈、更务实开放、外部数据供应链更弱、Nvidia 训练算力更紧缺,以及可能被低估的国内推理需求。
中文编译(四):全球均衡与开放模型
中国不能被规则化地理解
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者说,去中国前他知道自己知道得很少;离开后,他感觉自己只是刚刚开始学习。中国不是一个能用规则或食谱表达的地方,而是有非常不同的动态和化学反应。它的文化古老、深厚,并且仍然完全嵌入国内技术如何被建造的过程中。作者说自己还有很多要学。
\end{translationbox}
这段表现出作者的认识论谦逊。对中国 AI 的误读常来自过度规则化:“中国公司都这样”、“政府一定那样”、“中国市场不会付费”、“中国只会复制”。作者恰恰在提醒:这些规则可能太粗。
西方决策很难建模中国直觉
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者说,美国当前许多权力结构都把自己对中国的世界观作为决策的重要心理工具。但他与几乎所有中国领先 AI 实验室正式或非正式交流后,感到中国有许多品质和直觉,很难被西方决策方式建模。即使他直接询问为什么这些实验室要开放发布顶级模型,technology ownership mentality 与真诚生态支持之间的交集,仍然让他难以完全连点成线。
\end{translationbox}
这句话是全文最值得反复咀嚼的地方:开放权重在中国不是单一动机。 它既是控栈,也是生态;既是竞争策略,也是某种真诚支持开发者的方式;既是商业路径,也是技术声誉路径。
务实但非绝对的开放
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者说,中国实验室很务实,并不一定是 open-source absolutists,不是说每个模型都会开放。但它们确实有很深的 intentionality:支持开发者、支持生态,并把开放作为了解模型的一种方式。
\end{translationbox}
这里的 intentionality 可译为“有意为之”或“深思熟虑的意图”。作者不是说中国公司随便开放,而是说开放是被认真设计进模型战略中的。
开放模型的双重性质
开放模型既是公共技术生态的一部分,也是公司竞争策略的一部分。它可以同时服务于开发者、品牌、反馈、云服务、内部 fine-tuning、政策叙事和全球影响力。把它简化为“理想主义”或“亏本营销”都不够。
为什么几乎每个中国大科技公司都在做通用 LLM
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者说,几乎每个中国主要科技公司都在构建自己的 general purpose LLM。美团这样的配送服务公司、小米这样的广泛消费科技公司都发布开放权重模型。在美国,等价公司通常会直接购买服务。中国公司并不是为了追热点才做 LLM,而是因为它们深层渴望控制自己的 stack,掌握当下最重要的技术。作者抬头看见地平线上的起重机,觉得这与中国更广泛的建造文化和能量相匹配。
\end{translationbox}
这段很有画面感:模型建设与城市建设被作者连在一起。中国科技公司的控栈冲动,和中国经济长期形成的建设文化、基础设施文化相互呼应。
去地缘政治化的人性经验
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者说,中国研究者的人性、魅力和真诚温暖让人非常 humanized。在个人层面,美国习惯的尖锐地缘政治对话并没有渗透到他们身上。世界可以多一些这种简单的积极性。作为 AI 社区的一员,作者现在更担心的是,国籍标签正在让成员和群体之间出现裂缝。
\end{translationbox}
这段与开头呼应。作者在中美竞争之外,重新强调 AI 社区的全球性。他并不否认国家利益,但担心国家标签吞噬了技术共同体。
作者作为美国人的真实偏好
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者坦诚说,如果他说自己不希望美国实验室在 AI stack 的每一部分都保持明确领先,那是在撒谎,尤其是在他投入很多时间的开放模型领域。他是美国人,这是真实偏好。但与此同时,他希望开放生态本身能在全球繁荣,因为这能为世界创造更安全、更可访问、更有用的 AI。现在的问题是,美国实验室是否会采取步骤,占据这种领导位置。
\end{translationbox}
这段很诚实。作者不是“中立宇宙公民”,他有美国立场;但他的美国立场并不等于支持封闭。他想要的是美国在开放生态中领导,而不是退出开放生态。
开放模型与美国领导力的张力
如果美国以安全或竞争为由进一步限制开放模型,而中国实验室持续开放强模型,全球开发者生态可能自然流向中国开放权重模型。这样,美国也许保住了少数闭源公司的能力优势,却削弱了全球技术生态影响力。
结尾致谢
未转换的 LaTeX 环境:translationbox
\begin{translationbox}{原文主线编译}
作者感谢 Moonshot、Zhipu、Meituan、Xiaomi、Qwen、Ant Ling、01.ai 等团队中与他交流的人。他说大家都非常欢迎他,也慷慨给出时间。他会继续分享关于中国的一般文化和 AI 特定观察,因为这些知识显然会直接影响 AI 前沿发展故事。
\end{translationbox}
本章小结
结论部分把文章提升到全球开放生态问题:中国 AI 的崛起不是单纯竞争威胁,也是全球 AI 社区必须理解的新现实。美国如果想领导开放模型生态,需要主动建设,而不是只靠限制对手。
背景资料:文中出现的实验室、公司与模型
主要实验室与公司索引
| 文中涉及的中国 AI 生态参与者 | ||
|---|---|---|
| 名称 | 大致定位 | 与本文主题的关系 |
| 名称 | 大致定位 | 与本文主题的关系 |
| Moonshot AI / Kimi | 中国前沿模型创业公司,Kimi 助手和 Kimi 系列模型 | 代表中国新一代模型创业公司,兼具消费入口和开放权重/模型能力路线。 |
| Zhipu / Z.ai / GLM | 起源于清华生态的大模型公司,GLM 系列模型 | 体现高校人才、agent/coding 能力和国产模型生态的结合。 |
| Meituan / LongCat | 本地生活与配送巨头推出的模型线 | 作者用它说明:西方看来不像模型公司的业务公司,在中国也会自建 LLM 底座。 |
| Xiaomi | 消费电子、IoT、手机和汽车等硬件生态公司 | 代表 broad consumer technology company 自建模型以控制设备和交互 stack。 |
| Alibaba / Qwen | 云、商业和模型生态巨头 | 被视为中国 AI 生态中的 incumbent,拥有资源、云渠道和开放模型影响力。 |
| Ant Group / Ling | 金融科技和企业服务场景中的模型建设者 | 说明垂直业务巨头也将 LLM 视为未来基础技术,而非简单外采能力。 |
| ByteDance / Doubao | 拥有大规模消费产品分发和闭源模型的巨头 | 作者称其为中国 frontier closed lab,其他实验室对其非常警惕。 |
| DeepSeek | 以研究执行品味和开放模型著称的实验室 | 作者认为它是技术方向设定者,但未必是市场最终赢家。 |
| 01.ai | 李开复创办的大模型公司,Yi 系列模型广为人知 | 代表中国早期大模型创业潮和开放模型生态的一部分。 |
为什么业务公司也要做通用模型
在美国,配送、金融、手机或本地生活公司通常会购买模型 API;在中国,许多大公司选择自建通用模型。背后不是“都想成为 OpenAI”,而是担心未来关键技术栈被外部模型供应商控制。LLM 可能成为搜索、推荐、客服、研发、办公、设备交互、数据分析和自动化的共同底座。
开放权重、开源与闭源
文章多次使用 open、open-source、open-weight 等概念。中文讨论中容易混在一起,最好区分:
| 概念 | 含义 |
|---|---|
| Open-source | 严格意义上通常要求代码、权重、训练方式、许可证等满足开源规范。大模型领域很多项目并不完全满足。 |
| Open-weight | 开放模型权重,允许下载和部署,但训练数据、训练代码和完整 recipe 未必开放。当前许多“开源大模型”更准确地说是开放权重模型。 |
| Open model ecosystem | 围绕可下载模型形成的社区、工具、评测、微调、部署、应用和二次开发生态。 |
| Closed model | 权重不开放,只通过 API 或产品访问,例如许多美国 frontier model。 |
术语提醒
本文作者有时用 open-source 泛称开放模型生态,但严格说,很多中国和美国模型都是 open-weight,而不是完整 open-source。做技术和政策分析时,应尽量区分这两者。
为什么 Claude 在中国开发者中重要
作者提到“Most developers are Claude-pilled”,意思是很多中国开发者深受 Claude 影响,甚至有点“被 Claude 改造了开发方式”。这不是八卦,而是一个产业信号:
- coding agent 已经成为前沿模型能力的重要应用场景;
- 中国开发者对好工具的采纳非常务实;
- 如果本土模型能在 coding、tool use、long-horizon agent 上接近 Claude,会有巨大需求;
- Claude 的流行也解释了为什么 Kimi CLI、GLM CLI、Qwen Coder 等本土工具会成为重点方向。
从聊天助手到软件生产力
LLM 的商业价值正在从 chat UI 扩展到 coding workflow、agent workflow 和 enterprise automation。开发者是否愿意每天高频使用某个模型,可能比普通用户是否偶尔打开聊天产品更能预测推理需求。
Nvidia、Huawei 与算力分层
文章对芯片的说法可以总结为三层:
- 前沿训练:Nvidia 仍是黄金标准,尤其依赖 CUDA、通信库、集群稳定性、debug 经验和生态成熟度。
- 大规模推理:替代芯片更有机会,因为推理任务可优化、可分层部署,对训练生态依赖较低。
- 长期国产化:Huawei 等芯片被积极看待,但要完全替代前沿训练栈,需要硬件、软件、框架和人才共同成熟。
本章小结
背景资料帮助我们理解,文章不是在讨论一个抽象的“中国 AI”,而是在讨论多个不同类型主体:创业模型公司、云巨头、业务巨头、消费产品公司、闭源巨头、开放权重实验室和高校人才网络。
解读:作者观点背后的三条主线
主线一:LLM 竞争从算法竞争变成组织竞争
作者反复强调的不是某个算法,而是组织如何把大量小改进整合起来。今天的 LLM 前沿至少包括:
- pretraining 数据和架构;
- post-training 和 RL;
- tool use、coding、agentic workflows;
- inference cost 和服务稳定性;
- 评测、产品反馈和数据闭环。
因此,组织文化会影响技术结果。愿不愿意做脏活,能不能把个人 idea 放到整体目标之后,能不能快速吸收新范式,能不能让学生直接进入核心战场,都可能影响模型。
解读一
中国实验室的优势未必是“更聪明的单个研究者”,而是“更适合当前 LLM 系统工程的组织条件”。当技术路线从论文发明进入大规模集成阶段,这种组织条件会变得特别重要。
主线二:开放权重是控栈战略,不只是开源文化
很多人会问:中国公司为什么愿意开放强模型?作者给出的答案不是单一的:
- 开放模型获得社区反馈,帮助发现问题;
- 开放模型带来开发者采用,提高生态影响力;
- 开放模型可作为云和企业服务入口;
- 公司仍然可以保留内部 fine-tuned 版本;
- 对业务公司来说,开放底座有助于强化自己的技术 stack。
这解释了为什么开放权重可以与商业化并存。开放不是放弃控制,而是一种更复杂的控制方式:控制底座、控制内部数据、控制产品入口,同时让外部生态帮助模型变强。
开放模型的商业路径
开放权重模型可以通过云托管、企业私有化部署、模型微调、应用层产品、生态标准和硬件优化间接变现。它不一定依赖 API 闭源租赁这一种商业模式。
主线三:中美 AI 生态不是镜像
作者最反对的,是把中国实验室当作美国实验室的低成本镜像。两者确实都需要 talent、data、compute、capital,但每个变量的组织方式不同:
| 维度 | 美国典型路径 | 中国典型路径 |
|---|---|---|
| 模型供给 | 少数闭源 frontier lab 提供 API 和产品 | 多家开放权重模型和业务公司自建模型并存 |
| 企业采用 | 更接近 SaaS / API 采购传统 | 可能更接近 cloud / 基础设施 / 私有化部署 |
| 数据供应 | 外部供应商和高价 RL environment 更成熟 | 外部产业较弱,更多内部自建 |
| 人才叙事 | 明星科学家、创业、VC、公开播客叙事强 | 学生和工程团队密集投入,公共明星机制较弱 |
| 开放生态 | 顶级闭源模型强,开放模型领导力摇摆 | 开放权重强,开发者生态增长快 |
类别错误
用美国 SaaS 市场经验判断中国 AI 付费,用美国闭源 lab 逻辑判断中国开放权重,用美国明星科学家机制判断中国研究者动机,都可能犯类别错误。
本章小结
作者文章的深层价值,是把模型竞争还原为组织和生态竞争。中国 AI 的关键不是“有没有另一个 OpenAI”,而是它可能以不同公司结构、开放策略和控栈逻辑形成另一种前沿路径。
延伸分析:哪些判断最值得继续验证
验证点一:中国 AI 需求到底像 SaaS 还是 Cloud
如果 AI 支出像 SaaS,中国市场可能受限于传统软件付费文化;如果像 cloud,它可能成为研发、客服、数据分析、搜索推荐和自动化的基础设施。可以观察:
- 云厂商模型调用收入是否增长;
- 企业私有化部署和行业大模型项目是否持续付费;
- coding agent、客服 agent、办公 agent 是否进入高频工作流;
- 推理芯片和模型服务是否形成规模化价格竞争。
验证点二:开放权重能否形成全球开发者 moat
中国模型开放权重越强,全球开发者越可能在本地部署、微调和二次开发中选择它们。可观察:
- Hugging Face、GitHub、OpenRouter、云市场中的使用量;
- vLLM、SGLang、llama.cpp、Ollama 等推理生态支持速度;
- 企业是否把中国开放模型作为私有部署默认候选;
- 美国政策是否限制开放模型发布,反而给中国模型生态留出空间。
验证点三:中国能否从 fast follower 变成范式定义者
这是全文最大开放问题。可以看以下信号:
- 是否提出新的训练范式,而不只是优化既有路线;
- 是否产生国际社区主动跟随的 agent / RL / multimodal 方法;
- 是否在真实产品反馈上形成独特数据优势;
- 是否有足够基础研究空间,而不是所有人才都被短期模型竞赛吸走;
- 是否能在 Nvidia 受限下发展出不同的高效训练和推理技术路线。
从追赶到定义
fast-following 能让中国模型持续接近前沿,但范式定义需要另一套激励:允许失败、奖励原创问题、保留基础研究人才,并让研究者不只优化已经被证明有效的路线。
验证点四:美国开放模型战略会如何变化
作者最担心的是,美国一方面希望保持 AI 领导力,另一方面又可能通过行政命令或监管限制开放模型。这可能导致一个悖论:美国闭源模型继续领先,但全球开放开发者生态逐渐被中国模型占据。
领导力不只等于最强闭源模型
AI 领导力包括模型能力、开发者生态、标准、工具链、部署框架、硬件优化、教育资源和全球信任。如果美国只保留闭源能力,而放弃开放生态领导力,它可能失去一部分长期影响力。
本章小结
这篇文章最适合转化为四个观察题:AI 需求像什么、开放权重能否形成 moat、中国能否定义新范式、美国是否愿意领导开放生态。
批判性阅读:这篇文章可能低估或高估了什么
可能高估:文化解释的稳定性
作者很重视文化差异,例如谦逊、工程导向、少明星化。但文化解释有风险:它容易把某次访问中遇到的人概括成整体。中国实验室之间差异很大,团队阶段、融资状态、创始人风格、公司治理、所在城市都会影响研究者气质。
文化不是万能解释
当一个现象可以由组织阶段、资本结构、监管环境、市场竞争、人才年龄和公司规模解释时,不应过早归因于民族文化。文化是背景变量,但不是唯一变量。
可能低估:中国产业竞争的残酷性
作者感受到中国 AI 圈更像生态共同体,但中国互联网和 AI 行业的竞争同样激烈。价格战、人才挖角、资源集中、产品入口争夺都可能很残酷。off-the-record 的同行尊重,不一定意味着商业层面更温和。
可能高估:研究者与商业的分离
作者说中国研究者常说商业不是自己的问题。但在大公司内部,模型路线和商业场景往往深度绑定。研究者不公开评论商业,不等于研究任务不受业务目标塑造。例如推理成本、私有化部署、行业场景、中文能力、多模态入口都可能来自商业需求。
可能低估:中国原创研究的增长
作者保留了中国 0-to-1 原创性的疑问。这个疑问合理,但也要动态看。随着开放模型生态扩大、真实用户反馈积累、算力受限倒逼效率创新,中国团队可能在 agent、推理效率、多模态统一、低成本训练等方向产生不同原创性。
原创性不只有一种
学术意义上的 0-to-1 与工程意义上的 0-to-1 不完全相同。一个新算法是原创,一个能把成本降低一个数量级的系统设计也是原创,一个能让开放模型在真实业务中大规模运行的部署范式同样可能是原创。
本章小结
本文很有价值,但应把它视为强观察、弱定论。它提供的是一套值得继续验证的解释框架,而不是关于中国 AI 的最终答案。
术语表
| 本文相关术语 | |
|---|---|
| 术语 | 解释 |
| 术语 | 解释 |
| Fast follower | 快速跟随者。不是简单复制,而是在已有技术路线被证明后,快速吸收、工程化、扩展和降本。 |
| Agentic workflow | 让模型参与多步骤任务、工具调用、规划、执行和反馈循环的工作流。 |
| RL post-training | 预训练后通过强化学习、人类反馈、环境反馈等方式改进模型行为的阶段。 |
| Technology ownership mentality | 技术所有权心态,指公司倾向掌握关键底层技术,而不是完全依赖外部供应商。 |
| Open-weight model | 开放权重模型,可下载部署,但训练数据、完整代码和 recipe 未必开放。 |
| Closed lab | 权重和核心训练细节不开放,主要通过 API 或产品提供能力的实验室。 |
| Research taste | 研究品味,指判断哪些方向值得做、如何取舍、如何执行的能力。 |
| Build-not-buy | 能自建就不购买,尤其在关键技术栈上倾向内部掌握。 |
| Inference demand | 推理需求,即模型被实际调用、服务用户或业务流程的需求。 |
| Frontier training | 训练最前沿模型所需的大规模训练过程,通常对算力、数据、系统和稳定性要求极高。 |
总结与延伸
全篇总结
Nathan Lambert 的文章最有价值的地方,不是给出“中国 AI 强还是美国 AI 强”的答案,而是提供了一种更细的观察方式:
- 中国 AI 实验室在模型目标上接近美国前沿,但组织文化和产业逻辑不同。
- 当前 LLM 竞争高度依赖系统工程,中国团队的细节执行、年轻人才和较低个人明星政治可能构成优势。
- 中国公司自建 LLM 不是盲目追热点,而是出于技术所有权和控栈需求。
- 开放权重是务实策略,既支持生态,也服务公司自身反馈、品牌和内部 fine-tuning。
- 中国数据产业和训练算力仍有短板,但短板也推动内部自建能力。
- 美国如果忽视开放模型生态,可能在闭源模型领先的同时,失去全球开放开发者生态领导力。
最终 takeaway
理解中国 AI,不能只看模型榜单,也不能只看政策或芯片。更重要的是看“模型生产函数”:人才如何进入团队,组织如何处理 credit,数据如何构建,公司为什么控栈,开放模型如何获得反馈,算力约束如何塑造路线。
给中文读者的三个问题
- 如果中国模型公司最强的能力是工程化和快速吸收,那么中国高校和实验室应该如何保护更长期的原创研究?
- 如果业务公司都要掌握 LLM 底座,那么未来中国 AI 市场会更像云基础设施,还是会重新走向大型平台割据?
- 如果开放权重成为中国模型的全球优势,美国和其他地区会如何回应?是更开放,还是更封闭?
延伸阅读方向
继续理解本文,可以沿着四条线读:
- 开放模型线:DeepSeek、Qwen、Kimi、GLM、LongCat 等模型报告和社区采用情况。
- Agent/RL 线:coding agent、tool use、RL environment、Terminal-Bench、SWE-bench 等评测与训练方法。
- 产业组织线:中国云厂商、业务公司、硬件公司为何自建模型。
- 政策线:美国开放模型政策、中国地方政府 AI 产业政策、芯片出口管制与国产推理部署。
一句话收束
这篇文章真正提醒我们的是:AI 前沿不是只有模型能力曲线,还有人、组织、城市、公司、政策、供应链和生态。中国 AI 的故事,不只是追赶美国,而是在一套不同约束下,形成另一种建造前沿模型的方式。