
最近 Agent Skills 的热度持续走高,整个行业的跟进速度惊人:不仅 Claude 率先支持,VS Code、Cursor 等主流开发工具也纷纷跟进。借这篇短文,记录一下我对 Agent Skills 的学习和理解。
2025 年 10 月,Anthropic 首次推出 Agent Skill;同年 12 月,它被正式确立为开放标准。短短数月间,Agent Skill 从实验性功能,迅速成长为 AI Agent 领域的通用框架。为什么一个看似只是"说明文档"的机制,能让整个行业集体跟进?答案很简单:它精准击中了一个核心痛点,就是如何在不撑爆上下文的前提下,让 AI 更专业、更可控、更守规矩。
一、什么是 Agent Skills?
Agent Skill 本质上是大模型执行指令的"说明书",由三部分组成:
- Name(名称):技能的唯一标识,方便模型快速定位
- Description(描述):技能用途的高层说明,模型据此判断是否启用
- Content(内容):核心逻辑,包含业务流程、约束条件、示例和输出格式
进阶功能还引入了两个关键扩展:
Reference(引用)
- 本质:动态知识补丁
- 逻辑:仅在特定任务需要时加载外部文档
- 价值:支持相互引用和触发条件,让工作流从单线执行进化为可组合、可分支的结构
Script(脚本)
- 本质:无感知的执行单元
- 逻辑:模型发出指令,脚本在沙箱中运行
- 价值:几乎零 Token 消耗,模型只需获取结果
我认为 Reference 的一个重要意义在于:它不仅支持"相互引用",还可以灵活定义触发条件,从而让工作流从单线执行,进化为可组合、可分支、可复用的结构。Script 是一个黑盒式的代码执行环境。在普通模式下,模型只需要了解输入与输出的类型,调用执行工具获取结果,而不会占用上下文窗口。
二、核心机制:渐进式披露
Agent Skill 避免"上下文灾难"的关键在于动态加载,而非一次性灌入所有 Prompt:
- 静态感知:仅加载名称与描述,Token 占用极低,可同时管理成百上千技能
- 动态激活:任务需要时,才将具体内容注入上下文
- 按需扩展:通过 Reference 和 Script 引用大规模资源,实现极致效率
三、Agent Skills + MCP = 完整闭环
在实际应用中,Agent Skills 与 MCP(Model Context Protocol)共同构建 AI 的完整能力闭环:
- MCP:连接标准。解决"如何接 GitHub"“如何读数据库"等通信问题
- Agent Skills:业务标准。规定"数据怎么处理"“输出什么格式"“何时自动化”
简而言之:MCP 负责“搬运”数据,Agent Skill 负责“指挥”处理。相较之下,MCP 更像一套经过精心打磨的工具;而 Agent Skills 则提供更灵活的扩展能力,可以定义新的工作流和 if-else 场景,更像是一本为大模型准备的“参考指南(说明书)”。
展望:未来Agent (2026年伊始)
Agent Skills 的出现只是开始。随着 AI Agent 生态的成熟,我认为以下三个方向值得持续关注:
上下文与记忆管理:当前 Agent 仍然受限于上下文窗口的物理约束。未来需要更智能的记忆机制:哪些信息应该长期保存?哪些可以安全丢弃?如何在效率与准确性之间取得平衡?这涉及 memory 设计、长期状态维护、版本化记忆等多个子课题。
Agent-to-Agent 通信协议:单个 Agent 的能力终究有限。当多个 Agent 需要协作时,如何保证通信的稳定性?如何协调决策冲突?如何分配任务?这需要一套标准化的 A2A(Agent-to-Agent)协议,类似于互联网世界的 HTTP。
自演化的技能库:最令人期待的,是 Agent 能否像人类一样"学习新技能”——在执行任务的过程中,自动总结经验、创建新 Skill、优化已有 Skill、甚至组合多个 Skill 形成更复杂的能力。这将使 Agent 从"工具"进化为真正的"智能体”。
以上是我对 Agent Skills 的初步理解,欢迎交流讨论。