跳转至

姚顺雨:AGI-Next 峰会演讲

LaTeX 源码 · 备用 PDF

字段 内容
作者/整理 基于公开课程资料整理
来源 AITIME论道
日期 2025

姚顺雨:AGI-Next 峰会演讲

引言:AI行业的两大分化

姚顺雨(SWE-Agent作者,前OpenAI研究员,现就职于腾讯)在AGI-Next峰会上分享了他对AI行业趋势的深入观察。他指出两大正在发生的分化:

两大核心分化

  1. 2C与2B的分化:消费端(2C)和企业端(2B)的AI应用正在走向截然不同的发展路径
  2. 垂直整合 vs. 模型/应用分层:两种商业模式的分化日益明显

2C与2B的深层分化

2C端的感知停滞

姚顺雨观察到一个有趣的现象:当人们想到AI Super App时,现在脑中浮现的是两个产品——ChatGPT和Claude Code,分别代表2C和2B的典范。

2C端的悖论

对大部分人来说,今天使用ChatGPT的体验与一年前相比变化已经不大。虽然抽象代数、伽罗华理论等高端数学能力显著增强了,但普通用户感受不到。在中国,大部分人仍把AI当作“搜索引擎加强版”,不知如何激发模型的真正智能。

2B端的线性价值

2B端的价值逻辑

在2B端,智能越高 = 生产力越高 = 收入越多。这些目标之间是高度aligned的。例如一个OPUS 4.5级别的模型,10个任务可能8--9个直接做对,差的模型只做对5--6个。用户不知道哪些做错了,需要花大量精力监控。因此企业用户愿意花溢价(如每月200美元)使用最好的模型。

2C做AI的困难在于:DAU等产品指标往往与模型智能不相关,甚至可能成反比。而2B端模型越好、收入越高,所有事情都是aligned的。

2C端的真正瓶颈:Context而非模型

一个启发性的例子

“我今天该吃什么?”——这个问题无论今年、去年还是明年问ChatGPT,效果都不好。因为瓶颈不在于更大的模型或更强的RL,而在于额外的context:天气冷不冷、活动范围、家人的偏好等等。如果能把微信聊天记录等额外输入利用好,反而能带来更多用户价值。

本章小结

2C端的瓶颈在context和environment而非模型本身;2B端的价值链高度aligned,是更确定的增长方向。

垂直整合 vs. 模型/应用分层

传统认知的挑战

过去人们普遍认为垂直整合(模型+产品一体化)一定做得更好。但实际观察表明并不完全如此:

两种路径的对比

垂直整合:如ChatGPT、豆包等2C应用——模型与产品紧密耦合、联合迭代。

分层架构:如Claude/Gemini(模型层)+ Manus(应用层)——模型层和应用层需要的能力很不同,分别由最擅长的团队负责。

2C和2B的不同结论

在2C应用上,垂直整合仍然成立——产品与模型深度绑定。但在2B端,趋势似乎相反——模型变强的同时,会有更多应用层产品在不同生产力环节利用好模型。

自主学习:已经发生的渐变

自主学习的多重含义

“自主学习”在硅谷已成为热门话题,但每个人的定义不同。姚顺雨将其分为多种类型:

  • 聊天个性化:ChatGPT利用用户数据不断学习对话风格
  • 代码环境适应:越来越熟悉每个公司独特的环境和文档
  • 科学探索:像博士生一样从零学习有机化学成为领域专家

关键洞察:瓶颈在数据/任务,不在方法论

自主学习的真正瓶颈不是方法论(how),而是数据和任务(what and where)——在什么场景下、基于什么前提、用什么样的奖励函数去做。

自主学习已经在发生

Claude Code的自我改进

Claude Code已经写了自身项目95%的代码——从某种意义上说,它在帮助自己变得更好。这不就是一种自主学习吗?

类似地,Cursor的AutoComplete Model每几小时就用最新用户数据训练,Composer Model也在使用真实环境数据。这些都是自主学习的早期信号。

姚顺雨在2022--2023年做SWE-Agent时就提出:如果有一天SWE-Agent能自己改进SWE-Agent的代码仓库,那就是一种自我学习。Claude Code已经在大规模做这件事了。

渐变而非突变

姚顺雨认为自主学习更像渐变而非突变——目前的例子还局限在特定场景下,但趋势是明确的。最大的瓶颈是想象力:如果2026--2027年有新范式出现,那个Blog Post应该长什么样?它应该展示什么样的任务和效果?

大公司 vs. 创业公司的数据优势

十万人公司的数据多样性

像Anthropic这样的创业公司做coding agent数据,需要通过数据标注商——标注商规模有限,数据diversity受限。但如果是十万人的大公司(如腾讯),本身就有丰富的真实应用场景,可以捕捉到更diverse的真实世界数据,而不仅仅依赖标注商或Distillation。

2B Agent的两大瓶颈

环境与部署

姚顺雨指出,即使今天模型训练全部停止,只要把现有模型部署到世界各处的公司,可能就能带来GDP 5%--10%的影响。但今天AI对GDP的实际影响远不到1%。这说明瓶颈不在模型,而在部署和环境

教育的紧迫性

人与人的差距在拉大

不是AI替代了人的工作,而是会使用AI工具的人在替代不会使用的人。就像电脑刚发明时,学会编程的人vs.仍在使用算盘的人,差距是巨大的。中国目前能做的最有意义的事情之一就是——更好的AI教育。

中国AI的机遇与挑战

乐观的一面

  • 中国有非常强的人才储备
  • 任何被证明可行的技术,中国都能快速catch up甚至局部做得更好
  • 电力和基础设施优势明显
  • 类似制造业、电动车的成功模式可以复制

关键瓶颈

  1. 硬件瓶颈:光刻机能否突破?如果算力成为最终瓶颈,芯片产能和软件生态是关键
  2. 2B市场不成熟:中国2B支付意愿弱、文化不同,很多公司选择出海
  3. 主观层面——范式创新精神不足:中国人擅长在已证明的方向上做得更好,但在突破新范式、做冒险性探索方面还不够

中国唯一要解决的问题

“我觉得今天中国唯一要解决的问题是——我们到底能不能去引领新的范式。因为其他所有事情,无论是商业、产品设计还是catch up做工程,我们都已经不比美国做得差。”

关于研究文化

两点观察

  1. 偏好确定性:中国的研究者更倾向做已被证明可行的事情,在不确定的探索方向(如持续学习、长期记忆)上投入不足
  2. 过度关注榜单:中国大家对刷榜和数字看得更重。像Anthropic和DeepSeek做得好的一点是,更注重“什么是正确的事”和“自己体验能否感受到好坏”,而非追逐榜单数字

本章小结

中国AI在工程和产品层面已具备世界级竞争力,核心短板在于范式创新能力2B市场生态。突破光刻机、培育创新文化、加强AI教育是三个关键支点。

总结与延伸

姚顺雨的演讲涵盖了从行业格局到技术路线、从商业模式到文化反思的多个维度,核心观点可以归纳为:

  1. 2C vs. 2B正在分化:2B是更确定的增长方向,智能与收入高度aligned
  2. 垂直整合在2C成立,分层在2B成立
  3. 自主学习已在发生:是渐变而非突变,瓶颈在想象力和任务定义
  4. 2C的瓶颈是context,不是模型本身
  5. 中国的核心挑战:范式创新能力——“唯一要解决的问题”
  6. 教育紧迫:会用AI的人正在替代不会用的人

拓展阅读

  • SWE-Agent论文(2024):姚顺雨的代表工作,探索Agent的自主改进能力
  • Claude Code产品博客:Anthropic关于coding agent的技术细节
  • Cursor AutoComplete技术博客:实时用户数据驱动的模型微调
  • OpenAI O1系列技术报告:test-time scaling的开端