Claude Co-Work & Claude Code 深度解析

LaTeX 源码 · 备用 PDF

字段	内容
作者/整理	基于公开课程资料整理
来源	Greg Isenberg (YouTube)
日期	2026年1月

引言：Agent 时代来临

本期节目由 Greg Isenberg 主持，邀请到 Anthropic 的 Boris——Claude Code 的创造者、Claude Co-Work 的核心推动者——做客访谈。Boris 不仅展示了 Co-Work 的操作流程，还分享了他个人使用 Claude Code 的工作流和最佳实践。本讲义将从产品定位、使用方法、安全机制和高效工作流四个维度对谈话内容进行系统梳理。

核心观点

Claude Co-Work 的本质是将 Claude Code 的 Agent 能力包装到一个人人可用的 UI 中，其底层运行的是与 Claude Code 完全相同的 Claude Agent SDK。Co-Work 可以操作文件、控制浏览器、通过 MCP 连接任意工具——它不仅仅是聊天，而是真正意义上的 Agent。

什么是 Agentic AI？

Boris 指出，“agentic” 这个词在业界已被严重滥用。它的核心含义是：AI 可以采取行动（take action）——不仅仅是生成文本或搜索网页，而是能够使用计算机上的工具、与真实世界交互。Anthropic 从很早期就将 coding、tool use、computer use 作为模型训练的三大核心能力方向。

本章小结

Co-Work 是 Anthropic 面向非技术用户推出的 Agent 产品，它将 Claude Code 的全部 Agent 能力通过简洁的桌面端 UI 呈现出来。理解 “Agent = 能采取行动” 这一核心概念，是理解 Co-Work 所有功能的基础。

Claude Co-Work 产品详解

产品架构与入口

Claude 桌面应用目前包含三个标签页：

Chat：默认的对话界面
Co-Work：全新的 Agent 工作区
Code：即 Claude Code 终端界面

Boris 特别强调，Co-Work 底层直接调用 Claude Agent SDK——与 Claude Code 使用的是完全相同的 Agent 引擎。目前 Co-Work 仅支持 macOS，Windows 版本即将推出。

文件操作：从整理到自动化

Boris 演示的第一个场景是收据管理：

将桌面上的收据文件夹挂载到 Co-Work（需要用户主动授权，默认无权限）
输入指令：“我有一个收据文件夹，能否将文件按日期重命名？”
Co-Work 读取了四张收据，发现其中一张缺少日期，主动向用户求证——Boris 将此称为 Reverse Solicitation（反向请求）
完成重命名后，进一步将数据整理到电子表格

Reverse Solicitation（反向请求）

当模型对某些信息不确定时，它会主动向用户提问而非盲目假设。这一行为经过专门训练，是 Agent 安全运行的关键机制之一。对用户而言，与 Co-Work 的交互更像是在与一个认真负责的队友协作——它会在需要时寻求澄清。

浏览器操控：从本地到云端

当 Boris 提出 “也许我不想要本地电子表格，我想要一个 Google Sheet” 时，Co-Work 自动打开浏览器，导航到 Google Sheets，创建新表格并逐行填入数据。

浏览器能力的技术基础

Co-Work 内置了对 Chrome 浏览器的原生支持。模型可以：

读取屏幕内容（类似 computer use）
点击按钮、填写表单
在多个标签页之间导航

用户需要安装 Chrome Extension 并在每个站点首次访问时授权（可选择 “允许一次” 或 “始终允许”）。

Boris 还演示了让 Co-Work 打开 Gmail 并将表格发送给同事 Amy 的流程——模型自动查找联系人、撰写邮件正文并保存草稿等待确认。

多任务并行

并行工作流是核心范式

Co-Work 和 Claude Code 最强大的使用模式不是一次完成一个任务，而是同时运行多个任务。当一个任务正在执行时（如操控浏览器制作表格），用户可以新建另一个任务（如搜索播客创业灵感）。Boris 日常同时运行 5--10 个 Claude 实例。

Greg 在访谈中提出了一个关键思路：应该对公司的所有日常任务进行审计——梳理团队如何处理文件、使用互联网、发送信息，然后识别哪些环节可以交给 Co-Work 自动化。

Slack 集成与团队协作

Boris 分享了一个他每周使用多次的实际场景：

团队有一个项目追踪表格
Co-Work 检查表格中未填写的列
自动在 Slack 上给对应工程师发消息提醒

这个流程完全由 Co-Work 自主完成——Boris 只需发出指令，然后去喝杯咖啡。

本章小结

Co-Work 的核心使用场景涵盖文件整理、浏览器操作、邮件/Slack 通信和多任务并行。对于非技术用户而言，Co-Work 去除了终端的技术门槛，同时保留了 Claude Code 的全部 Agent 能力。其安全机制（授权、reverse solicitation、沙箱）确保了操作的可控性。

安全与信任机制

多层安全架构

Boris 用了大量篇幅强调 Anthropic 在安全方面的投入，主要分为以下几层：

模型层——对齐与可解释性：Anthropic 的核心使命是 AI 安全。在模型训练阶段，通过 alignment（对齐）和 mechanistic interpretability（机制性可解释性）确保模型行为符合用户意图。Boris 类比说，这就像用科学方法研究人脑神经元一样研究 AI 的内部结构。
运行时——虚拟机沙箱：Co-Work 底层有一个完整的虚拟机运行环境，确保任何操作都不会影响用户的宿主系统。
用户层——删除保护：新增的 deletion protection 机制会在删除文件前提示用户确认。
网络层——Prompt Injection 防护：当模型与互联网交互时，内置了针对 prompt injection 攻击的防护措施。

安全仍在演进中

Boris 坦承这些防护并不完美，Anthropic 仍在持续迭代。尽早发布产品的重要原因之一，就是要在真实使用场景中观察和研究模型的行为模式，以进一步改进安全性。

权限模型

Co-Work 采用最小权限原则：

文件系统：默认无权访问任何文件夹，需要用户逐一挂载
浏览器：每个网站首次访问需要单独授权
操作确认：敏感操作（如发送邮件、删除文件）会在执行前求证

本章小结

Anthropic 构建了从模型内部（对齐、可解释性）到运行环境（沙箱隔离）再到用户交互（权限、确认）的多层安全体系。Co-Work 的设计哲学是 “安全优先、逐步放权”。

Skills：可复用的能力模块

什么是 Skill？

Skill 本质上是一种可复用的任务执行模式。Boris 解释说，Co-Work 在之前的演示中制作 Excel 表格时，实际上加载了一个预装的 Excel skill——这就是模型知道如何正确操作 Excel 的原因。

Skill 的价值主张

如果你使用的工具或文件格式比较特殊（如 AutoCAD、Salesforce），你可以编写自定义 Skill 来教会 Claude 如何操作它。拥有更多 Skill 的 Co-Work 实例能够处理更广泛的任务，输出质量也更高。

使用建议

Boris 的建议是先简单后复杂：

安装 Co-Work + Chrome Extension 即可开始使用
不要一上来就花时间定制 Skill
当发现 Co-Work 在某个具体场景下表现不佳时，再考虑编写对应的 Skill
Skill 更适合进阶用户作为性能优化手段

本章小结

Skill 是 Co-Work 和 Claude Code 的可扩展能力层。它让用户可以将领域知识编码为可复用的模块，从而提升 Agent 在特定任务上的表现。

Claude Code 最佳实践

本节内容来自 Boris 在 X/Twitter 上发布的一条病毒式传播帖文（99,000 书签），以及他在节目中的深度展开。

并行多 Claude 工作流

Boris 的工作方式

Boris 同时运行 5--10 个 Claude 实例：

本地终端中通常保持多个 tab，每个 tab 一个独立的 git checkout
当本地 tab 用完后，溢出到 Web 端继续开新任务
每天早上起床后通过 iOS app 启动 2--3 个 Claude 任务
大约一半的代码现在是通过手机端 Claude 完成的

Boris 坦言他一年前绝不会预料到自己的编码方式会变成这样——通过手机和 Web 分发任务，像管理一个 AI 团队一样在各个实例之间巡回检查。

始终使用最强模型

Boris 推荐始终使用 Opus 4.5 with Thinking（非 Sonnet）：

为什么更大的模型反而更便宜？

这是一个反直觉的发现：虽然 Opus 4.5 的单 token 价格高于 Sonnet，但因为它更聪明，所以：

完成同一任务消耗的总 token 数更少
需要的人工修正次数更少
总体成本和时间往往低于使用较小模型

类比：雇一个高级工程师的时薪虽高，但因为不需要反复返工，总成本可能低于雇一个初级工程师。

CLAUDE.md 是团队知识库

CLAUDE.md 的最佳实践

团队共享一个 CLAUDE.md 文件，提交到 Git 仓库
全团队每周多次更新：每当发现 Claude 犯错，立即将修正规则加入 CLAUDE.md
格式完全自由——就是一个普通文本文件，没有特殊语法要求
每个团队维护自己的 CLAUDE.md，各团队自行负责保持其更新

Boris 展示了 Claude Code 仓库的 CLAUDE.md 截图——内容非常简洁朴素，证明了“不需要复杂格式，只需要持续维护”的理念。

Plan Mode：先规划再执行

“Once the plan is good, the code is good.”

Boris 的大多数会话以 Plan Mode 开始：

进入 Plan Mode，与 Claude 反复讨论方案
方案确认后，切换到 Auto-accept Edits 模式
Claude 通常可以一次性（one-shot）完成整个 PR

这与 Spec-driven Development 思路一致，但更灵活——“spec” 只是一个文本形式的计划，不需要特定格式。

GitHub Action 与复合工程

Boris 的第五条建议涉及在代码审查中持续积累团队知识：

通过 /install-github-action 在仓库中安装 Claude GitHub App
在 PR review 中 @claude 让它执行修改或更新 CLAUDE.md
这确保同一类问题永远不需要指出两次

复合工程（Compound Engineering）

Boris 引用了 Dan Schipper 的“复合工程”概念：在 Meta 工作时，Boris 会维护一个电子表格记录代码审查中出现的问题，当某个问题出现 5--10 次后就编写 lint 规则来自动化检查。现在 CLAUDE.md + GitHub Action 就是这个理念的 AI 时代版本——每次发现问题，立即让 Claude 更新知识库，确保下次不再犯同样的错。

给 Claude 验证自身输出的能力

Boris 认为这是提升 Claude Code 效果的三大关键之一（与使用 Opus 和维护 CLAUDE.md 并列）：

“蒙眼画家” 类比

如果一个画家必须戴着眼罩作画，即便技艺再高超也无法画出好作品。同理，如果 Claude 无法看到自己写的代码的运行结果，它的输出质量就会大打折扣。因此：

构建 Web App 时，务必启用 Chrome Extension 让 Claude 能在浏览器中查看效果
始终让 Claude 运行测试、启动服务器、查看模拟器输出
让 Claude 能够自我验证和修正，是从“尚可”到“优秀”的关键跨越

本章小结

Boris 的 Claude Code 最佳实践可以归纳为五个核心原则：

并行：同时运行多个 Claude，像管理团队一样分配任务
最强模型：始终使用 Opus 4.5 with Thinking
知识积累：持续维护 CLAUDE.md 作为团队知识库
先规划：用 Plan Mode 确保方案正确，再进入自动执行
自我验证：让 Claude 能看到并验证自己的输出

未来展望

代码的消亡与重生

Boris 和 Dario Amodei 一年前都预言 “到年底人们将不再亲手写代码”。到 2026 年 1 月录制节目时，Boris 表示在过去两个月中，他的所有代码（每月 200--300 个 PR）100% 由 Claude Code 编写，他没有手写过一行代码。

指数思维 vs 线性思维

Boris 强调，人类大脑天生按线性方式思考，但 AI 能力的增长是指数级的。一年前如果按线性推算，绝不可能想到模型已经能完全替代人类编码。唯一能做出正确预测的方法是“相信指数曲线，然后沿着它画下去”。

Co-Work 的平台潜力

Greg 和 Boris 都将当前的 Agent 生态比作 iPhone App Store 的早期：

2008 年 App Store 刚推出时，最火的是啤酒模拟器等玩具应用
没人预见到 Uber、DoorDash、TikTok 会从中诞生
Co-Work 正处于类似阶段——使用场景的爆发将超出所有人的想象

Boris 预见的趋势是：越来越多的日常琐碎工作（在 App A 和 App B 之间搬运数据、格式转换、状态汇报等）将被 Agent 接管，人类将聚焦于自己真正享受的创造性工作。

本章小结

AI Agent 的发展遵循指数曲线。Co-Work 作为 Agent 平台的意义类似于 App Store 之于移动互联网——真正的杀手级应用尚未出现，但基础设施已经就绪。

总结与延伸

本次访谈的核心信息可以提炼为以下几点：

Co-Work 的定位：Claude Code 的能力 + 人人可用的 UI，是非技术用户进入 Agent 世界的入口
安全设计：多层防护体系（模型对齐 → 沙箱隔离 → 权限控制 → 用户确认）
工作范式转变：从“深入单任务”转向“并行管理多个 AI 实例”，工程师的角色更像是“AI 团队的管理者”
知识复合：CLAUDE.md 是团队级的知识积累机制，确保错误不会重复出现
验证闭环：让 Agent 能够看到并验证自身输出，是提升质量的关键

拓展阅读

Boris 的 X/Twitter 帖文：Claude Code 使用技巧（99K 书签）
Dan Schipper：Compound Engineering 概念
Anthropic Blog：Claude Agent SDK 文档
Claude Code GitHub Action：/install-github-action 命令