Jan 6, 2026·essay·3 min

Agent Skills:缺失的那一层

Agent Skills 如何让 AI 在不撑爆上下文窗口的前提下保持专业与可控。

Agent Skills Architecture

近来 Agent Skills 的关注度持续升温。Claude 率先推出,如今 VS Code、Cursor 等主流工具也纷纷跟进。

本文将分享我对 Agent Skills 的一些观察与思考。

Anthropic 于 2025 年 10 月推出 Agent Skills,到 12 月便迅速被业界广泛采纳。短短数月之间,原本只是实验性的特性迅速演变为面向 AI Agent 的通用框架。一个看似只是"说明文档"的机制,何以在业界引发如此广泛的关注?原因很直接:它切实地回应了一个长期存在的问题——如何在不让上下文窗口膨胀乃至崩溃的前提下,让 AI 变得更强、更可靠。

1. 什么是 Agent Skills?

可以将一个 Agent Skill 视为面向 LLM 的"说明手册"。它由三个基本部分组成:

  • Name:唯一标识,供模型准确定位
  • Description:简要描述,用于模型判断是否调用该 Skill
  • Content:具体的执行逻辑,包括工作流、约束、示例与输出格式

在此之上,还有两种重要的扩展机制:

  • Reference

    • 含义:按需调用的外部知识
    • 机制:仅在需要时加载外部文档
    • 意义:将线性执行转化为模块化、可分支的工作流
  • Script

    • 含义:黑箱式的执行单元
    • 机制:由模型调用,脚本在沙箱中运行
    • 意义:几乎不消耗 token——模型只接收最终结果

Reference 的独特之处在于可以定义触发条件,从而把简单的工作流组合成可复用、可拼装的流水线。

Script 则将繁重的计算完全排除在上下文之外,模型只看到输入与输出,而不涉及代码本身。

2. 核心机制:上下文的渐进式披露

Agent Skills 通过分阶段、按需加载的方式来规避上下文过载:

  1. 静态感知:初始阶段只加载 Name 与 Description,以极少的 token 让模型获得对更多 Skill 的感知能力。
  2. 动态激活:只有当任务真正需要某个 Skill 时,其完整内容才被注入上下文。
  3. 按需展开:Reference 与 Script 依据实际需要被调用,让模型能够扩展到更多可能的路径。

3. Agent Skills + MCP = 完整图景

在实际使用中,Agent Skills 与 MCP(Model Context Protocol)是相辅相成的:

  • MCP 负责固定的工作流与工具接入,例如连接 GitHub、读取数据库等。
  • Agent Skills 负责处理逻辑、输出格式,以及在不同 Skill 与 Script 之间的自动化触发。

简而言之:MCP 定义模型与外部工具的连接方式,Agent Skills 定义连接建立之后要做什么。MCP 更像是一套打磨精良的工具箱,Agent Skills 则更像一份灵活的行动手册,定义了模型需要遵循的工作流、条件分支与业务规则。

展望:Agents 的下一步(2026 年初)

Agent Skills 只是起点。随着生态走向成熟,有三个方向尤为值得关注:

  1. 上下文与记忆:当前的 Agent 仍受制于上下文长度。我们需要更聪明的记忆系统,决定什么该保留、什么该遗忘,以及如何在速度与准确性之间取得平衡。这涉及长期状态、版本管理与检索策略等一系列问题。

  2. Agent-to-Agent 协议:单个 Agent 能做的事情终归有限。多 Agent 协作需要稳定的通信机制、冲突解决与任务协调——可以把它理解为"面向 AI 的 HTTP",即一套标准化的 A2A 协议。

  3. 自我演化的 Skills:最令人期待的方向,是让 Agent 在实际工作中持续学习——创造新的 Skill、打磨既有的 Skill,并将它们组合为更强的能力。当这一步真正实现,Agent 就不再只是工具,而是名副其实的合作者。


以上是我对 Agent Skills 的一些初步思考,欢迎交流。