结构化输出与工具调用：LangChain / OpenAI API

结构化输出与工具调用的本质

在构建复杂 Agent Workflow 时，模块之间需要明确的接口约定——一个环节的输出是另一个环节的输入。结构化输出解决了三个核心问题：

结构化输出 = 弱版 SDD

结构化输出某种意义上实现了一种弱版的 Specification Driven Development——通过定义 Module 之间的输入输出格式，极大简化了解析和适配工作。其底层原因在于现代大语言模型在结构化输出方面已经训练得非常好。

结构化输出和工具调用是 Agent 开发的基础设施——通过 API 层面的格式约定，省略了大量手工的 Prompt 设计和输出解析工作。

通过 response_format 字段传入 Pydantic Model 的 JSON Schema：

通过 tools 字段注入工具信息：

HTTP 抓包分析

通过 HTTP 抓包可以清晰看到：

两者在 HTTP 请求层面是不同的字段，但目的都是约定输入输出格式。

在 OpenAI API 的 HTTP 请求层面，结构化输出通过 response_format 实现，工具调用通过 tools 实现——理解底层机制有助于 debug 和优化。

LangChain 的 with_structured_output 方法进一步简化了使用：

两种路径的区别

with_structured_output \(\rightarrow\) 走 response_format（JSON Schema 对齐到字段语义）
bind_tools \(\rightarrow\) 走 tools（Function Calling 语义）

Pydantic Model 本质上也是一种 Function（实例化类 \(\approx\) 调用构造函数），所以 LangChain 的 bind_tools 也可以接受 Pydantic Model。

LangChain 在 OpenAI API 的基础上做了进一步封装——自动序列化、自动反序列化，使用体验更简洁。

通过结构化输出实现 Chain of Thought

可以将思考过程封装为一个 Pydantic 结构化输出对象，例如：

通过这种方式约定实现 CoT 效果，自然可以比较大地提升模型表现。这是一个非常实用的语言模型使用技巧。