张钹院士：迈向通用人工智能

LaTeX 源码

字段	内容
作者/整理	基于公开课程资料整理
来源	AITIME论道
日期	2025

张钹院士：迈向通用人工智能

引言：大语言模型究竟掌握了什么？

张钹院士（清华大学人工智能研究院名誉院长，中国科学院院士）从语言学和哲学的高度，系统分析了大语言模型的原理、局限，以及迈向通用人工智能（AGI）的真正挑战。

他从一个根本性的问题出发：机器能不能像人类一样理解语言？

大语言模型的成就与局限

在外部提示下，机器已经能够在开放领域生成多样性的、语义上连贯的、类似人类的语言。这算不算掌握了人类语言？答案是：算，但还不够彻底。它在很多地方与人类语言仍有本质差异。

分布式语义：大模型的理论基础

从稀疏到稠密

大语言模型的核心原理是分布式语义——用一个词周围的上下文来定义这个词的意义（Firth的经典观点）。

关键技术突破

将语言从高维空间中的稀疏表示转化为稠密的向量空间几何结构，这是一个重大进步。它使得语言处理问题完全变成了数学计算问题——原来稀疏的共现空间不可计算，变成稠密向量空间后就可以用数学工具处理。

可证明的极限性质

可以证明：只要数据量足够多、上下文足够长，这个向量空间就会趋近于语义关系空间。这解释了为什么当前研究都在追求更长的上下文和更多的数据。

语义趋近的含义

一旦向量空间趋近了语言的语义关系，在一定意义下就可以做到“理解”，甚至可以做到自反性——对自己的思考进行思考。这在大语言模型中已经被观察到了。

本章小结

大语言模型基于分布式语义原理，通过稀疏到稠密的向量空间转换，实现了语言的可计算化。但这种语义定义本身是近似的。

模型近似的五大缺陷

语义定义的根本困境

张钹院士提出了一个深刻的观点：当前大语言模型中出现的很多怪现象，不能简单归结于数据问题。

被广泛误解的归因

“很多人发现机器里出现很多怪现象，都归结于数据问题。这是完全错误的。现在很多东西是由于模型近似引起的。”世界上有七八种不同哲学学派对“语义”的定义，没有任何一种是科学上完备的。分布式语义只是其中一种近似。

五大缺陷

由于语义定义的不完备性，大语言模型必然存在以下五个缺陷：

大语言模型的五大固有缺陷

指称缺陷：模型不能真正指向现实世界中的实体
真实和因果缺陷：模型缺乏因果推理能力，只能捕捉统计相关性
语用缺陷：模型无法真正理解语言在特定社会情境中的使用规则
多义和动态缺陷：词义的多样性和动态变化超出了静态向量表示的能力
语境和闭环行为缺陷：模型缺乏与物理环境的闭环交互能力

张钹院士强调：这五个缺陷是固有的、必然存在的——不是通过更多数据或更大模型就能消除的，因为问题的根源在于语义定义本身的不完备。

AGI的可操作定义：五项关键能力

为什么需要新定义

张钹院士指出，当前对AGI的定义（如马斯克的“能完成人类70%以上任务”）完全不可执行、不可检验，必然引起争议。

模糊定义的危害

以模式识别为例：识别率超过人类就算“达到人类水平”吗？有人说算，有人说从鲁棒性来看差得远。模糊的定义让AGI的讨论陷入无休止的口水战。

五项关键能力

张钹院士提出了一个可执行、可检验的AGI定义，即必须达到以下五项关键能力（特别注意每项的限定形容词）：

AGI的五项关键能力

时空一致的多模态理解——关键在“时空一致性”：不同模态的时间节奏不同步（视频逐帧、文本千年一句），对齐极其困难
在线的学习和适应——区别于离线学习；核心挑战是可控性，强化学习过程能否收敛到目标
可检验的推理和长期的规划——推理结果必须可验证；规划必须具备长期性
可检验的反思和元认知——当前反思都是“感觉性”的，缺乏可回溯、可验证的信号
跨任务的泛化——不仅是跨领域泛化（大模型已做得较好），还必须是分布外、结构不同、长尾场景下的跨任务泛化

形容词为什么重要

张钹院士反复强调“形容词非常重要”。例如：“多模态理解”很多团队都在做，但加上“时空一致”后难度骤增；“推理”很多模型都有，但“可检验的”推理则是完全不同的要求。这些限定词划定了真正的技术前沿。

从LLM到Agent：实现路径

当前的六大技术方向

张钹院士认为，当前业界正在做的六件事都是冲着上述五个目标来的：

多模态融合与具身交互
检索增强（RAG）
结构化知识对齐
工具与执行的绑定
对齐与约束
在线学习与适应

本章小结

从LLM到能执行复杂任务的Agent，需要在五个维度上取得突破。当前六大技术方向各有对应，但每个方向都面临着从“有”到“好”的关键形容词挑战。

AI主体性的三个层次

张钹院士提出了人工智能作为“主体”的三个发展层次：

三个主体层次

行为主体（Agent of Action）：机器作为工具执行人类指令——已经达到，我们很希望它达到，因为它帮助我们
规范和责任主体（Agent of Norm）：机器能够承担责任——尚未达到，技术难度较高，但是可追求的目标
体验和意识主体（Agent of Consciousness）：机器拥有意识——这是最令人担忧的层次

对于实际从业者，张钹院士建议关注前两个层次，不必过早考虑第三个层次。

对齐与治理：治理的对象是人，不是机器

对齐的悖论

对齐到底对齐什么？

机器一定要和人类对齐吗？人类自身存在贪婪、欺骗等缺陷——而这些恰恰是机器原本没有的。人类道德并非最高标准。那么“对齐”到底该对齐什么？这值得深入讨论。

治理研究者与使用者

张钹院士明确指出：最重要的治理对象不是机器，而是人类——特别是研究者和使用者。AI时代的企业家必须承担更大的社会责任。

AI时代企业家的新使命

张钹院士过去不赞成学生创业，但大模型出现后改变了看法——最优秀的学生应该去做企业，因为人工智能重新定义了企业家的角色。

六项新职责

AI时代的企业家不再是简单地赚钱，而应：

重新定义价值创造：不是简单提供产品和服务，而是将知识和推理变为可复用的工具
将AI作为像水和电一样的通用技术交给人类
承担社会责任与治理职责
实现普惠的可持续增长
参与AI安全与伦理建设
推动教育与人才培养

总结与延伸

张钹院士的演讲从哲学和科学的根基出发，为我们理解AGI的路径提供了深刻的框架：

理论基础：分布式语义使语言可计算化，但语义定义本身是近似的
五大固有缺陷：指称、因果、语用、多义/动态、闭环行为——源于模型近似而非数据不足
AGI的可操作定义：五项关键能力，每项的限定形容词划定了真正的技术前沿
从LLM到Agent：六大技术方向对应五个目标
主体性三层次：行为主体 \(\rightarrow\) 规范主体 \(\rightarrow\) 意识主体
治理的核心：治理人（研究者和使用者），而非机器
企业家新使命：从赚钱到造福人类，AI重新定义了企业家角色

拓展阅读

Firth (1957): “A Synopsis of Linguistic Theory”——分布式语义的哲学根基
语义学七大流派（指称论、真值条件论、语用学、认知语义学等）
AGI等级定义：OpenAI的L1--L5框架与Google DeepMind的AGI分类
可检验推理（Verifiable Reasoning）的最新研究进展
张钹院士此前关于“第三代人工智能”的系列论述