Agent Skills：缺失的那一层

Agent Skills 如何让 AI 在不撑爆上下文窗口的前提下保持专业与可控。

近来 Agent Skills 的关注度持续升温。Claude 率先推出，如今 VS Code、Cursor 等主流工具也纷纷跟进。

本文将分享我对 Agent Skills 的一些观察与思考。

Anthropic 于 2025 年 10 月推出 Agent Skills，到 12 月便迅速被业界广泛采纳。短短数月之间，原本只是实验性的特性迅速演变为面向 AI Agent 的通用框架。一个看似只是"说明文档"的机制，何以在业界引发如此广泛的关注？原因很直接：它切实地回应了一个长期存在的问题——如何在不让上下文窗口膨胀乃至崩溃的前提下，让 AI 变得更强、更可靠。

1. 什么是 Agent Skills？

可以将一个 Agent Skill 视为面向 LLM 的"说明手册"。它由三个基本部分组成：

Name：唯一标识，供模型准确定位
Description：简要描述，用于模型判断是否调用该 Skill
Content：具体的执行逻辑，包括工作流、约束、示例与输出格式

在此之上，还有两种重要的扩展机制：

Reference
- 含义：按需调用的外部知识
- 机制：仅在需要时加载外部文档
- 意义：将线性执行转化为模块化、可分支的工作流
Script
- 含义：黑箱式的执行单元
- 机制：由模型调用，脚本在沙箱中运行
- 意义：几乎不消耗 token——模型只接收最终结果

Reference 的独特之处在于可以定义触发条件，从而把简单的工作流组合成可复用、可拼装的流水线。

Script 则将繁重的计算完全排除在上下文之外，模型只看到输入与输出，而不涉及代码本身。

2. 核心机制：上下文的渐进式披露

Agent Skills 通过分阶段、按需加载的方式来规避上下文过载：

静态感知：初始阶段只加载 Name 与 Description，以极少的 token 让模型获得对更多 Skill 的感知能力。
动态激活：只有当任务真正需要某个 Skill 时，其完整内容才被注入上下文。
按需展开：Reference 与 Script 依据实际需要被调用，让模型能够扩展到更多可能的路径。

3. Agent Skills + MCP = 完整图景

在实际使用中，Agent Skills 与 MCP（Model Context Protocol）是相辅相成的：

MCP 负责固定的工作流与工具接入，例如连接 GitHub、读取数据库等。
Agent Skills 负责处理逻辑、输出格式，以及在不同 Skill 与 Script 之间的自动化触发。

简而言之：MCP 定义模型与外部工具的连接方式，Agent Skills 定义连接建立之后要做什么。MCP 更像是一套打磨精良的工具箱，Agent Skills 则更像一份灵活的行动手册，定义了模型需要遵循的工作流、条件分支与业务规则。

展望：Agents 的下一步（2026 年初）

Agent Skills 只是起点。随着生态走向成熟，有三个方向尤为值得关注：

上下文与记忆：当前的 Agent 仍受制于上下文长度。我们需要更聪明的记忆系统，决定什么该保留、什么该遗忘，以及如何在速度与准确性之间取得平衡。这涉及长期状态、版本管理与检索策略等一系列问题。
Agent-to-Agent 协议：单个 Agent 能做的事情终归有限。多 Agent 协作需要稳定的通信机制、冲突解决与任务协调——可以把它理解为"面向 AI 的 HTTP"，即一套标准化的 A2A 协议。
自我演化的 Skills：最令人期待的方向，是让 Agent 在实际工作中持续学习——创造新的 Skill、打磨既有的 Skill，并将它们组合为更强的能力。当这一步真正实现，Agent 就不再只是工具，而是名副其实的合作者。

以上是我对 Agent Skills 的一些初步思考，欢迎交流。