收藏!小白程序员必看:LLM生产力大爆发,掌握MCP与Skills的进化之路

收藏!小白程序员必看:LLM生产力大爆发,掌握MCP与Skills的进化之路svg xmlns http www w3 org 2000 svg style display none svg

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



 
  
    
     
      
     

本文对比了LLM智能体工具MCP与Skills的发展历程、优缺点及适用场景。MCP作为连接外部工具的标准协议,存在跨厂商标准化缺失、安全风险及上下文管理等问题。Skills则通过文件系统组织代码工具,实现高效的任务执行,但需MCP补充以支持商业服务和第三方服务交互。二者并非替代关系,而是相辅相成,共同推动AI生产力发展。

MCP的作用与优势自然不必多说,上图是Anthropic公司给我们描述的以及网络上人们讨论MCP的美好画面。然而对于自己设计过MCP Sever或使用过MCP Tools的人来说,这画面并非故事的全部,MCP的安全风险、用户体验以及技术设计都存在一些问题(早在2025年3月,Mnaus首席科学家Peak就说出了“Actually, Manus doesn’t use MCP”,可见其团队AI认知的市场领先性)

下图是社交媒体上一个关于MCP的梗图,它非常形象地反应了当前MCP的尴尬现状

总结起来,MCP作为AI智能体连接外部工具的标准协议,虽在标准化集成方面具有优势,但仍存在多方面的不足之处:

  • 协议层面:缺乏垮厂商标准化
  • 虽然Anthropic公司开源了MCP协议
  • 执行安全和隔离机制不足
  • 这一点已得到改进,在2025年6月18日的更新中,协议增强了安全性(如明确MCP服务器作为OAuth资源服务器的角色
  • 上下文同步与状态管理复杂,一次性加载全部Tools,大量消耗Token

    (假设服务数为M,每个服务包含的Tools数量为N,则总Tools数量为M*N),这挤占了本来就很宝贵的智能体Agent上下文空间 - 即所谓“上下文爆炸”,这就决定了MCP + Tools组合形式的不可扩展性(No Scaling)。

  • 这点严重阻碍了MCP的发展,在这个背景下,Skills机制的思路被探讨提出,即让大模型通过编写代码来动态调用外界工具,而不是一次性获得所有工具定义,这有助于管理复杂的工具集和大量数据返回,提升上下文空间的利用率。

注:虽然Claude Code MCP团队近期也提出了动态加载工具的思路以减少上下文Token数量(Tool Search now in Claude Code: https://x.com/trq212/status/),但Skills概念已深入人心。

Claude.md 是Anthropic公司提出的一种项目上下文注入机制——当在 Claude 桌面应用中与某个项目文件交互时,Claude 会自动读取项目根目录下的 Claude.md 文件,并将其内容作为持久化指令注入到对话上下文中,主要是为了提高提示词的使用效率。

AGNET.md则是OpenAI和Google一起提出的对Claude.md/GEMINI.md/CODEBUDDY.md等机制的一个厂商标准化设计(所有Agent厂商都可以实现支持,这样开发者就不需要每个厂商写一个全局md文件)。它的核心思想为

  • 统一标准:一个文件服务所有 AI 编程工具
  • 开放格式:由 OpenAI、Google 等共同制定,非专有
  • 智能就近:支持嵌套,离文件最近的 AGENTS.md 优先

AGENTS.md: One File for All Agents - by Aravind Putrevu

如果把LLM比喻为计算机的CPU,Context是内存,AGENTS.md则是这台智能机的外接硬盘(以文件系统组织形式)。

既然文件组织形式这么好用,为什么不推而广之?同时,在创建Agent应用实践过程中工程师们逐渐认识到这样一个现象:AI所有使用的工具类型当中,使用代码工具(写代码+执行代码)执行任务最擅长,完成任务的效率最高(UIUC的王星尧博士的《Executable Code Actions Elicit Better LLM Agents》论文专门研究了这个主题,读者可自行搜索阅读之)。Anthropic公司也认识到:Claude固然强大,但实际工作不仅需要流程性知识,还需要组织背景信息。于是在2025年10月Anthropic推出了Agent Skills:一种基于文件和文件夹构建专业智能体的新方式,其核心理念是让用户可以将专业知识和工作流程打包成"技能包",使 Claude 从通用 AI 助手变身为特定领域的专家。

注:2025年7月,Manus工程博客发表《AI Agent的上下文工程:构建Manus的经验教训》,其中一条即为:使用文件系统作为上下文,再一次感叹Manus团队的超前认知。

也就是说:当文件系统遇上代码工具,计算机的生产力就彻底被解放了。这种设计思想最终可以追溯到:Unix/Linux “一切皆文件”的设计哲学。

一句话解释Skills:以文件系统的形式组织专业知识与工作流的技能包/工具箱。

下图是Anthropic官方收录的skills集合,基本上涵盖了职场人士的高频技能任务,如office套件、前端设计、画图等

https://skillsmp.com/zh 是民间收录的skills集合,当前技能数已达6w+。也就是说一旦定义为skills,这些技能就可以通过智能体Agent为所有人共享。如果说软件世界里的代码/库是操作行为上的复用,Skills则是方法论上的复用,而且是自然语言维度上的复用。这也意味着数字世界skills能力的边际成本已趋近为0。昨日,社交媒体上阿里千问App上的“一句话点奶茶外卖”的能力便是这些工具应用的冰山一角。

既然Skills这款Agent工具如此好用,是不是可以不需要MCP了?并不是。在单机里、在简单环境、在初级任务里,Skills机制确实可以很出色的完成使命。但现实世界尤其是商业环境,各个平台提供的服务都不尽相同,同一个平台的各业务方向执行环境也并非完全共享。这一切都需要一种可以交换商业服务的标准化协议,而且需要透明、安全、高效,这便是MCP存在的必要性。

Anthropic《Equipping agents for the real world with Agent Skills》

上图是Claude Code使用Skills与MCP的真实场景,二者的主要职责可以表述如下:

  • Skills:use computer模式下(单机环境),skills使用bash/python/node.js等程序工具完成任务。
  • MCP:如果需要其他Agent服务或者第三方服务,则需要通过MCP工具获取

所以:Skills不是MCP的替代,而是MCP的补充。

1)不必纠结于MCP 和 Skills的概念本身,不妨站在技术的历史发展进程视角看看,可能一切都会变得清晰起来。

2)虽然表面上看智能体Agent技术一直在被Authropic公司引领,但其实Manus团队才是工程实践先驱,这个话题可以单独开一篇专门介绍。

3)标题有点标题党之嫌,如果看完仍有疑惑,不妨在评论区吐槽,一起继续讨论

对于刚入门大模型的小白,或是想转型/进阶的程序员来说,最头疼的就是找不到系统、全面的学习资源,要么零散不成体系,要么收费高昂,白白浪费时间走弯路。今天就给大家精心整理了一份全面且免费的AI大模型学习资源包,覆盖从入门到实战、从理论到面试的全流程,所有资料均已整理完毕,免费分享给各位!

核心包含:AI大模型全套系统化学习路线图(小白可直接照做)、精品学习书籍+电子文档、干货视频教程、可直接上手的实战项目+源码、2026大厂面试真题题库,一站式解决你的学习痛点,不用再到处搜集拼凑!

扫码免费领取全部内容

在这里插入图片描述

理论是实战的根基,尤其是对于程序员来说,想要真正吃透大模型原理,离不开优质的书籍和文档支撑。本次整理的书籍和电子文档,均由大模型领域顶尖专家、大厂技术大咖撰写,涵盖基础入门、核心原理、进阶技巧等内容,语言通俗易懂,既有理论深度,又贴合实战场景,小白能看懂,程序员能进阶,为后续实战和面试打下坚实基础。

在这里插入图片描述

无论是小白了解行业、规划学习方向,还是程序员转型、拓展业务边界,都需要紧跟行业趋势。本次整理的2026最新大模型行业报告,针对互联网、金融、医疗、工业等多个主流行业,系统调研了大模型的应用现状、发展趋势、现存问题及潜在机会,帮你清晰了解哪些行业更适合大模型落地,哪些技术方向值得重点深耕,避免盲目学习,精准对接行业需求。值得一提的是,报告还包含了多模态、AI Agent等前沿方向的发展分析,助力大家把握技术风口。

在这里插入图片描述

对于程序员和想落地能力的小白来说,“光说不练假把式”,只有动手实战,才能真正巩固所学知识,将理论转化为实际能力。本次整理的实战项目,涵盖基础应用、进阶开发、多场景落地等类型,每个项目都附带完整源码和详细教程,从简单的ChatPDF搭建,到复杂的RAG系统开发、大模型部署,难度由浅入深,小白可逐步上手,程序员可直接参考优化,既能练手提升技术,又能丰富简历,为求职和职业发展加分。

img

2026年大模型面试已从单纯考察原理,转向侧重技术落地和业务结合的综合考察,很多程序员和新手因为缺乏针对性准备,明明技术不错,却在面试中失利。为此,我精心整理了各大厂最新大模型面试真题题库,涵盖基础原理、Prompt工程、RAG系统、模型微调、部署优化等核心考点,不仅有真题,还附带详细解题思路和行业踩坑经验,帮你精准把握面试重点,提前做好准备,面试时从容应对、游刃有余。

img

结合上述资源,给大家整理了一份可直接落地的四阶段学习规划,总时长约2个月,小白可循序渐进,程序员可根据自身基础调整节奏,高效掌握大模型核心能力,快速实现从“入门”到“能落地、能面试”的跨越。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范
第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署
第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建
第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

扫码免费领取全部内容

在这里插入图片描述

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
在这里插入图片描述
在这里插入图片描述




这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

小讯
上一篇 2026-04-26 13:13
下一篇 2026-04-26 13:11

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/281614.html