张钹院士:迈向通用人工智能
| 字段 | 内容 |
|---|---|
| 作者/整理 | 基于公开课程资料整理 |
| 来源 | AITIME论道 |
| 日期 | 2025 |

引言:大语言模型究竟掌握了什么?
张钹院士(清华大学人工智能研究院名誉院长,中国科学院院士)从语言学和哲学的高度,系统分析了大语言模型的原理、局限,以及迈向通用人工智能(AGI)的真正挑战。
他从一个根本性的问题出发:机器能不能像人类一样理解语言?
大语言模型的成就与局限
在外部提示下,机器已经能够在开放领域生成多样性的、语义上连贯的、类似人类的语言。这算不算掌握了人类语言?答案是:算,但还不够彻底。它在很多地方与人类语言仍有本质差异。
分布式语义:大模型的理论基础
从稀疏到稠密
大语言模型的核心原理是分布式语义——用一个词周围的上下文来定义这个词的意义(Firth的经典观点)。
关键技术突破
将语言从高维空间中的稀疏表示转化为稠密的向量空间几何结构,这是一个重大进步。它使得语言处理问题完全变成了数学计算问题——原来稀疏的共现空间不可计算,变成稠密向量空间后就可以用数学工具处理。
可证明的极限性质
可以证明:只要数据量足够多、上下文足够长,这个向量空间就会趋近于语义关系空间。这解释了为什么当前研究都在追求更长的上下文和更多的数据。
语义趋近的含义
一旦向量空间趋近了语言的语义关系,在一定意义下就可以做到“理解”,甚至可以做到自反性——对自己的思考进行思考。这在大语言模型中已经被观察到了。
本章小结
大语言模型基于分布式语义原理,通过稀疏到稠密的向量空间转换,实现了语言的可计算化。但这种语义定义本身是近似的。
模型近似的五大缺陷
语义定义的根本困境
张钹院士提出了一个深刻的观点:当前大语言模型中出现的很多怪现象,不能简单归结于数据问题。
被广泛误解的归因
“很多人发现机器里出现很多怪现象,都归结于数据问题。这是完全错误的。现在很多东西是由于模型近似引起的。”世界上有七八种不同哲学学派对“语义”的定义,没有任何一种是科学上完备的。分布式语义只是其中一种近似。
五大缺陷
由于语义定义的不完备性,大语言模型必然存在以下五个缺陷:
大语言模型的五大固有缺陷
- 指称缺陷:模型不能真正指向现实世界中的实体
- 真实和因果缺陷:模型缺乏因果推理能力,只能捕捉统计相关性
- 语用缺陷:模型无法真正理解语言在特定社会情境中的使用规则
- 多义和动态缺陷:词义的多样性和动态变化超出了静态向量表示的能力
- 语境和闭环行为缺陷:模型缺乏与物理环境的闭环交互能力
张钹院士强调:这五个缺陷是固有的、必然存在的——不是通过更多数据或更大模型就能消除的,因为问题的根源在于语义定义本身的不完备。
AGI的可操作定义:五项关键能力
为什么需要新定义
张钹院士指出,当前对AGI的定义(如马斯克的“能完成人类70%以上任务”)完全不可执行、不可检验,必然引起争议。
模糊定义的危害
以模式识别为例:识别率超过人类就算“达到人类水平”吗?有人说算,有人说从鲁棒性来看差得远。模糊的定义让AGI的讨论陷入无休止的口水战。
五项关键能力
张钹院士提出了一个可执行、可检验的AGI定义,即必须达到以下五项关键能力(特别注意每项的限定形容词):
AGI的五项关键能力
- 时空一致的多模态理解——关键在“时空一致性”:不同模态的时间节奏不同步(视频逐帧、文本千年一句),对齐极其困难
- 在线的学习和适应——区别于离线学习;核心挑战是可控性,强化学习过程能否收敛到目标
- 可检验的推理和长期的规划——推理结果必须可验证;规划必须具备长期性
- 可检验的反思和元认知——当前反思都是“感觉性”的,缺乏可回溯、可验证的信号
- 跨任务的泛化——不仅是跨领域泛化(大模型已做得较好),还必须是分布外、结构不同、长尾场景下的跨任务泛化
形容词为什么重要
张钹院士反复强调“形容词非常重要”。例如:“多模态理解”很多团队都在做,但加上“时空一致”后难度骤增;“推理”很多模型都有,但“可检验的”推理则是完全不同的要求。这些限定词划定了真正的技术前沿。
从LLM到Agent:实现路径
当前的六大技术方向
张钹院士认为,当前业界正在做的六件事都是冲着上述五个目标来的:
- 多模态融合与具身交互
- 检索增强(RAG)
- 结构化知识对齐
- 工具与执行的绑定
- 对齐与约束
- 在线学习与适应
本章小结
从LLM到能执行复杂任务的Agent,需要在五个维度上取得突破。当前六大技术方向各有对应,但每个方向都面临着从“有”到“好”的关键形容词挑战。
AI主体性的三个层次
张钹院士提出了人工智能作为“主体”的三个发展层次:
三个主体层次
- 行为主体(Agent of Action):机器作为工具执行人类指令——已经达到,我们很希望它达到,因为它帮助我们
- 规范和责任主体(Agent of Norm):机器能够承担责任——尚未达到,技术难度较高,但是可追求的目标
- 体验和意识主体(Agent of Consciousness):机器拥有意识——这是最令人担忧的层次
对于实际从业者,张钹院士建议关注前两个层次,不必过早考虑第三个层次。
对齐与治理:治理的对象是人,不是机器
对齐的悖论
对齐到底对齐什么?
机器一定要和人类对齐吗?人类自身存在贪婪、欺骗等缺陷——而这些恰恰是机器原本没有的。人类道德并非最高标准。那么“对齐”到底该对齐什么?这值得深入讨论。
治理研究者与使用者
张钹院士明确指出:最重要的治理对象不是机器,而是人类——特别是研究者和使用者。AI时代的企业家必须承担更大的社会责任。
AI时代企业家的新使命
张钹院士过去不赞成学生创业,但大模型出现后改变了看法——最优秀的学生应该去做企业,因为人工智能重新定义了企业家的角色。
六项新职责
AI时代的企业家不再是简单地赚钱,而应:
- 重新定义价值创造:不是简单提供产品和服务,而是将知识和推理变为可复用的工具
- 将AI作为像水和电一样的通用技术交给人类
- 承担社会责任与治理职责
- 实现普惠的可持续增长
- 参与AI安全与伦理建设
- 推动教育与人才培养
总结与延伸
张钹院士的演讲从哲学和科学的根基出发,为我们理解AGI的路径提供了深刻的框架:
- 理论基础:分布式语义使语言可计算化,但语义定义本身是近似的
- 五大固有缺陷:指称、因果、语用、多义/动态、闭环行为——源于模型近似而非数据不足
- AGI的可操作定义:五项关键能力,每项的限定形容词划定了真正的技术前沿
- 从LLM到Agent:六大技术方向对应五个目标
- 主体性三层次:行为主体 \(\rightarrow\) 规范主体 \(\rightarrow\) 意识主体
- 治理的核心:治理人(研究者和使用者),而非机器
- 企业家新使命:从赚钱到造福人类,AI重新定义了企业家角色
拓展阅读
- Firth (1957): “A Synopsis of Linguistic Theory”——分布式语义的哲学根基
- 语义学七大流派(指称论、真值条件论、语用学、认知语义学等)
- AGI等级定义:OpenAI的L1--L5框架与Google DeepMind的AGI分类
- 可检验推理(Verifiable Reasoning)的最新研究进展
- 张钹院士此前关于“第三代人工智能”的系列论述