协会地址:上海市长宁区古北路620号图书馆楼309-313室
MCP应用:拓展前沿——Agentic AI Foundation
作者: Agentic AI Foundation
原文链接: https://aaif.io/blog/mcp-apps-extending-the-frontier/
深入解读 Ido Salomon 与 Liad Yosef 在 2026 年北美 MCP 开发者峰会上的主题演讲
Ido Salomon 和 Liad Yosef 在开场时几乎带着歉意:他们前一天才准备好演讲内容,而它可能已经过时了。他们或许是对的。
四个月前,MCP 应用(MCP apps)还不是官方标准。如今,它已内置于 Claude、ChatGPT、VS Code、Cursor、GitHub Copilot、Postman 和 Goose 中。OpenAI 已将 MCP 应用作为第三方开发者在 ChatGPT 内构建交互式体验的标准方式。这场演讲与其说是产品发布,不如说是来自前沿的实时报道,其中展示了由 MCP 应用实现的仪表盘和应用 UX 迭代的惊艳演示。
从基于文本的 Agent 输出到更丰富的用户体验
仅从 AI Agent 接收文本是一种极其受限的视觉和应用体验。例如,如果你向 AI Agent 询问产品漏斗情况,却得到一大段文字,这堆文字会让人不知所措——而且对于真正理解正在发生的事情几乎毫无用处。即使文本准确且信息丰富,现实依然如此。一图胜千言。因此,即使信息都在那里,文本密集的界面也不适合人类消费和交互。
问题比美学层面更深刻。对于通过 MCP 将其产品连接到 AI 系统的公司来说,文本响应存在隐藏成本。它们剥离了视觉和品牌标识。每个 SaaS 产品都有品牌、设计语言以及用户认可并信任的信息呈现方式。当工具返回纯文本时,所有这些都消失了。产品变成了一个枯燥、扁平的数据库。用户体验成了别人的问题。
MCP 应用是 Ido 和 Liad 同时解决这两个问题的答案,他们在主题演讲中展示了令人印象深刻的进展。请看下图。这些只是粗略的例子,但仍然有用。第一张图展示了当今大多数 AI Agent 返回的内容:一段文本。第二张图是 MCP 应用实现的效果:工具自身的界面直接嵌入聊天中。它带有品牌标识、熟悉且生动。它的酷炫之处在于,这不是一个静态界面,它能响应点击,触发新的模型交互。从任何有意义的角度来看,它们都是真正的应用,但又是真正意义上的生成式应用。每个用户可能会根据自己的品味和需求获得略有不同(或非常不同)的用户体验。画布仅受限于 LLM 的图形生成能力和 Agent 层。

MCP 应用的工作原理
据 Ido 和 Liad 介绍,这一转变背后的架构实际上比乍看起来要简单得多。
- 从文本到 HTML:他们解释说,如今在 MCP 中调用工具时,通常返回纯文本。而使用 MCP 应用,工具会指向一个 HTML 资源——该资源可以即时生成,也可以从缓存中拉取。
- 宿主(Host)的角色:无论用户是在 Claude、VS Code 还是 ChatGPT 中,宿主都会获取该资源并将其渲染为完全可交互的组件。这使得用户能够看到由工具创建者构建并带有品牌标识的真实 UI,直接嵌入在 AI 界面中。
交互循环
Ido 和 Liad 强调,最关键的设计决策在于交互循环的位置。
“当用户点击这些组件中的某个元素时,事件不会直接返回给工具服务器。它会返回给宿主,宿主再通过模型将其路由回去。”
通过让模型保持在循环中,Agent 能够完全感知每一个动作。它可以实时响应、调用其他工具或更新 UI。结果是无缝的体验,用户无需输入命令或切换标签页即可完成任务。
公开构建规范的这四个月
Ido 独立创建了 MCPUI,探索通过 MCP 发送 UI 的可能性。当 OpenAI 在一次早期峰会(当时 MCPUI 概念难以获得关注)四天后发布其 Apps SDK 时,这个想法获得了真正的动力。突然间,世界上使用最广泛的 AI 宿主拥有了交互式应用,人们开始关注。
Anthropic、OpenAI 和 MCPUI 团队共同制定了规范。一个月后草案出炉。又过了两个月,Claude 和 VS Code 发布了官方支持。如今,生态系统包括 VS Code、Cursor、GitHub Copilot、Claude、ChatGPT、Postman 和 Goose,都遵循同一标准。官方 SDK 名为 ext-Apps,意味着开发者只需编写一次应用,即可在所有宿主中运行。
下一步将构建什么
规范仍处于早期阶段,路线图进展迅速,但 Ido 和 Liad 最关注的是两项新能力。
第一个问题是可复用视图(reusable views)。目前,每次工具调用都会用新渲染的界面替换当前 UI。对于简单的交互来说这或许没问题,但在像 Autodesk 或 Google Analytics 仪表盘这类信息密集、内容丰富的应用中,这种做法会变得非常干扰。为了解决这个问题,团队正在探索 App Tools——一项提案,它能让智能体像人类一样与现有 UI 交互,而不是反复替换整个视图。
第二个问题是生成式 UI(generative UI)与预定义 UI(predefined UI)之间的平衡。Claude 最近推出的生成式 UI 功能已经运行在 MCP apps 之上,这表明第三方品牌界面和第一方 AI 生成的界面可以共存于同一框架内。与此同时,工作组正努力确保与 AGUI 和 WebMCP 等项目的互操作性,目标是连接这些不同的方法,而不是让它们相互对立。
你也可以帮助塑造 MCP 的 UX 层!
没错,真的。这个规范还很年轻,在许多方面仍有大量工作要做。正如 Liad 在演讲中所说:“你实际上可以成为这个协议如何落地的一部分。”MCP apps 规范工作组每三周召开一次会议,并接收来自宿主构建者、服务器构建者和社区贡献者的意见。就连那些小型 UI 组件该叫什么名字的问题,也是通过社区调查解决的。
规范会持续演进。工作组会继续开会。而那些参与并做出贡献的人,将在最终构建的内容上拥有真正的发言权。对于任何在 AI 宿主之上进行构建的人来说,现在是时候站出来塑造未来了(并且,希望也能学到很多东西)。
MCP apps 是一个开放标准。工作组每三周公开召开一次会议。你可以在官方 MCP apps 仓库中找到规范、SDK 和社区。如果你正在构建一个 MCP 服务器并希望为其添加丰富的界面,那么 ext-apps 就是你的起点。







