最近两年,AI 圈的新名词比老板画的饼还要多。从最初的“提示词工程(Prompt Engineering)”,到后来的“智能体(Agent)”、“MCP协议”,最近你是不是又经常刷到“大模型 Skill”

很多人听到新词就头大:这又是什么高深的技术?

别慌,今天咱们就用最接地气的方式——甚至用一杯“豆浆”的例子,把这个看起来高大上的 Skill 给说明白。看完你会发现,原来 AI 正在经历一场从“只会动嘴”到“真能动手”的进化。

一、 从“做豆浆”看懂提示词的局限

要理解 Skill,我们得先回到梦开始的地方——提示词。

最开始我们用 AI,就像面对一个刚学做饭的小白。
你问它:“豆浆怎么做?”
它回你:“泡黄豆少许,加水适量,煮沸。”

听完你就懵了:什么是少许?什么是适量?这做出来能喝吗?

后来我们学聪明了,知道提问要具体。于是提示词变成了这样:

“请告诉我做甜豆浆的详细步骤。材料精确到克,时间精确到秒,我喜欢喝浓一点的,请给我具体的参数……”

这样一来,AI 回答得确实顺畅多了。

但问题随之而来:我们攒了太多这种又长又复杂的提示词了。写代码的、读论文的、写周报的……

我们面临两个巨大的痛点:

  1. 太贵太慢:如果每次提问都把这几十个超长提示词一股脑发给 AI,Token 消耗巨大,反应也慢。
  2. AI 也会懵:无关信息太多,AI 反而不知道你到底想干啥。

有没有一种机制,能让我们别把所有家底都发给 AI,而是让它根据问题,自己挑着用呢?

有,这就是 Skill


二、 Skill 到底是个啥?

简单来说,Skill 就是被精心“打包”和“管理”好的高级提示词,外加执行能力。

你可以把一个 Skill 想象成电脑里的一个文件夹。
比如一个“写菜谱 Skill”文件夹,里面有一个核心文件 skill.md,这里面存着你精心调教的那几千字的超详细菜谱提示词。

但关键在于,我们不能直接把这几千字发给 AI。我们得在这个文件的开头,写一段简短的介绍(Metadata,元数据),比如:

“这是一个用于生成精确到克和秒的详细菜谱的技能。”

这就好比图书馆里的书,你可以不看全书,但你得先看目录和简介。

三、 Skill 是怎么跑起来的?(核心三步走)

当我们要 AI 做事时,Skill 的运行机制简直可以用“丝滑”来形容,分三步:

第一步:发现(Discovery)——只看“目录”

当你问 AI:“如何做豆浆?”
系统并没有把那几千字的菜谱提示词发过去,而是把你所有的 Skill 的那段简短介绍(Metadata)打包发给了 AI。

这就像你去图书馆,管理员先扔给你一堆书的目录索引,而不是直接把书砸你脸上。这样既省 Token,又清晰明了。

第二步:激活(Activation)——按需“调阅”

AI 看完目录,脑子一转:“哟,这哥们要看菜谱,那个‘写菜谱 Skill’正合适。”

于是,AI 会向系统发送一个特殊指令:“把‘写菜谱 Skill’的完整内容拿给我看看。”

系统收到指令,这才把那个几千字的 skill.md 完整文件读取出来发给 AI。

第三步:执行(Execution)——不仅能读,还能动!

这是 Skill 最牛的地方,也是它区别于普通提示词的关键。

以前的 AI 只能给你生成文字版的菜谱。但如果是一个 Skill,它可以在文件夹里自带脚本小程序。

比如一个“处理 PDF 的 Skill”。AI 读完说明书后发现,要解决你的问题,需要把 PDF 转成图片。它不再只是告诉你“你可以用某某软件转换”,而是能直接发出一条执行令(Execution Command),指挥你的电脑运行 Skill 文件夹里自带的那个 Python 小脚本,啪的一下,把图给你转好了。

甚至,如果你告诉 AI 你的电脑里装了哪些 Python 库,它还能现场手写代码并运行来解决你的问题。

总结

看到这里,你应该明白了。

以前我们搞提示词工程,是在教 AI 怎么“说话”。
现在我们搞 Skill,是在给 AI 装上“手”和“工具箱”。

执行能力给了 AI 真正的行动力,而 Skill 则为 AI 指明了行动的方向。

当 AI 学会在 Skill 划定的边界内,谨慎地使用它那强大的执行能力时,真正的智能体时代才算刚刚开始。

各位,准备好迎接会动手的 AI 了吗?