基座模型的快速迭代和大模型价格下降带动了 AI 产业的繁荣,底层基模的能力边界、工具调用和数据的可连接性、数据的价值挖掘共同决定了 Agent 的最终呈现效果。
本文将从 Agent 和 MCP 的角度,分析下为未来大模型应用开发的趋势和主要的形式,并在文末给大家介绍国内首本MCP图书。
Agent 智能体
Agent 是一个能够自主决策并采取行动的软件系统,它能够观察环境、使 用工具,并以目标为导向执行任务。Agent 具备以下几个关键特征:
自主性:可以在无人工干预的情况下运行,独立做出决策。
目标驱动:具备主动性,即使没有明确指令,也会推理如何完成任务。
环境感知:能够处理外部输入,如用户请求、传感器数据或数据库信 息。
可扩展性:可以整合不同的工具(API、数据库、计算模块等),提升 执行能力。
适应性:能根据任务需求调整行为,优化执行路径。
工作流静态,智能体更为动态。根据 Anthropic 的区分,当任务明确定义, 需要可预测性和一致性时,选择工作流。当任务需要灵活性和模型驱动的动态决策时,选择智能体。
特性
工作流(Workflow)
智能体(Agent)
定义
通过预定义流程编排 LLM 和工具的系统
LLM 动态决定自己的处理过程和工具使用的系统
优势
稳定、准确、可预测
解决没有固定流程的开放性问题
局限性
为准确性牺牲了解决问题的延迟
无明确局限性(根据描述未提及)
Agent 的架构模块的划分主要包含了:感知、记忆、规划、行动四个核心 的要素,同时包括定义(管理 Agent 角色特性)、学习(预训练、小样本学习)、 认知与意识(思考、整体认知)等特色模块。
感知:接收输入信息,这个信息可以是用户输入或者是通过传感器在 环境中获取信息;
记忆:长期记忆存储与上下文管理,用于处理复杂任务;
规划:任务分解、子任务生成及自我反思;
行动(工具使用):通过 API 或外部工具增强 Agent 的能力(如搜索、 文件操作,代码执行等)。
规划模块以 LLM 的推理规划能力为核心。 LLM 作为Agent 的核心决策引擎, 它决定 Agent 如何分析信息、精准的拆解任务、动态推理、做出选择、执行。 在此过程中通常会用到各种 Prompt 框架、多 Agent 协同、模型微调等方法, 来提高 LLM 推理规划能力。
工具使用模块主要用于扩展 Agent 访问外部世界的能力。 Agent 通过访问 API、数据库等外部接口,使其能够执行检索、计算、数据存储等操作。通过 工具使用,Agent 不仅能与外部世界进行实时交互,获取最新信息,还能在特 定领域发挥专业优势。
模型上下文协议(MCP)
2024 年11 月,Claude 的母公司Anthropic 推出了模型上下文协议(MCP), MCP 是一种开放协议,提供连接 LLM 与所需的上下文的一种标准化方式,可以实现 LLM 应用与外部数据源和工具的无缝集成。
传统开发模式中,大模型调用外部服务需要经历复杂的技术链路: 自然语言理解——业务逻辑解析——API 调用——结果处理,每个环节都可能产生信息损耗,造成映射模糊、能力黑洞、风险敞口等问题。
MCP 统一不同大模型和不同服务之间的协议, MCP 主要由 Host、MCP Client、MCP Server 等组件构成:
Host:内置了 MCP Client 的应用程序,可以是 APP、Agent、Web 应 用、桌面应用等等形态;
MCP Client:大模型与 MCP Server 之间的桥梁;
MCP Server:负责处理来自 MCP Client 的请求,并调用各种资源, 返回相应的结果或数据。
工具的调用从最初的 fuction call 到后续的 GUI 再到目前的 MCP,大模型工具获取的能力在不断完善。
MCP 主机(位于左侧)是 AI 驱动的应用程序,例如 Claude Desktop、一个集成开发环境(IDE)或其他充当代理的工具。主机连接到多个 MCP 服务器,每个服务器都暴露了一个不同的工具或资源。
MCP 服务器就像一个智能适配器,用于连接工具或应用程序。它知道如何将来自 AI 的请求(例如“获取今天的销售报告”)翻译成该工具能够理解的命令。例如:
一个 GitHub MCP 服务器可能会将“列出我的开放拉取请求”转换为一条 GitHub API 调用。
一个文件 MCP 服务器可能会将“将这个总结保存为文本文件”写入到你的桌面。
一个 YouTube MCP 服务器可以按需转录视频链接。
MCP 客户端
在另一端,MCP 客户端位于 AI 助手或应用程序内部(例如 Claude 或 Cursor)。当 AI 想要使用某个工具时,它会通过这个客户端与对应的服务器进行通信。例如:
Cursor 可以使用客户端与你的本地开发环境进行交互。
Claude 可能会使用它来访问文件或从电子表格中读取数据。
客户端负责处理所有的来回通信——发送请求、接收结果并将它们传递给 AI。
MCP 协议
MCP 协议是保持一切同步的关键。它定义了客户端和服务器之间的通信方式——消息的格式、动作的描述方式以及结果的返回方式。它非常灵活:
可以在本地运行(例如在你的 AI 和计算机应用程序之间)
可以通过互联网运行(例如在你的 AI 和在线工具之间)
使用像 JSON 这样的结构化格式,以保持一切清晰和一致
由于这种共享协议的存在,AI 代理可以连接到一个全新的工具——即使是它从未见过的工具——并且仍然能够理解如何使用它。
编辑推荐:首本MCP图书
如今MCP正成为AI落地的关键基建。但想要真正掌握其设计思想、避坑实践与企业级部署方案,仍需系统化学习——首本MCP深度解析专著《MCP原理与实战:高效AI Agent智能体开发》 现已上市!
通过 MCP,开发者无须针对不同的大模型重复编写集成代码,只需遵循统一的标准即可实现兼容。所有支持 MCP 的大模型,都能直接访问通过该协议接入的数据源、功能或服务。
掌握MCP=掌握AI应用标准化提效密码,企业智能化落地速度翻倍!
9大AI场景,50个实战案例,详细讲解资源、工具、提示模板与双传输层的实现机制。
以 Python 与 Node.js 双栈为例,从零开始编写天气与邮件服务器,并在 ClaudeDesktop、Cursor、Copilot Studio 中完成 MCP 客户端接入与链路调试,演示如何在30 分钟内让大模型读取私有数据、触发真实操作。
尊敬的博文视点用户您好: 欢迎您访问本站,您在本站点访问过程中遇到任何问题,均可以在本页留言,我们会根据您的意见和建议,对网站进行不断的优化和改进,给您带来更好的访问体验! 同时,您被采纳的意见和建议,管理员也会赠送您相应的积分...
时隔一周,让大家时刻挂念的《Unity3D实战核心技术详解》终于开放预售啦! 这本书不仅满足了很多年轻人的学习欲望,并且与实际开发相结合,能够解决工作中真实遇到的问题。预售期间优惠多多,实在不容错过! Unity 3D实战核心技术详解 ...
如题 ...
读者评论