协会地址:上海市长宁区古北路620号图书馆楼309-313室
代码智能体是你构建所有智能体的基石
作者:Sam Partee
本文翻译自:Coding Agents Are the Foundation for Every Agent You’ll Ever Build

作者山姆・帕蒂(Sam Partee),是 Arcade.dev 联合创始人兼 AI 研究负责人。本文基于作者与哈里森・蔡斯(Harrison Chase,LangChain 创始人)在 2026 年 3 月 3 日”代码智能体:AI 驱动开发大会”上的联合演讲整理而成。
代码智能体,是你构建所有智能体的基石。在现实世界中完成实际工作所需的核心能力 —— 持久化状态、工具调用、迭代执行,早已被代码智能体攻克。当我们不断优化代码智能体时,其他所有类型的智能体都会同步实现能力升级。
代码智能体的本质
代码智能体拥有文件系统、持久化工作空间、可调用的工具集,以及迭代执行的能力。这些并非只是编写代码的专属功能,而是任何处理复杂任务的智能体都必备的核心原语。把编译器换成客户关系管理系统(CRM),你就能得到一个销售智能体 —— 二者的底层架构完全一致。
工作空间模式
大多数智能体开发者,都试图把所有内容塞进大模型的上下文窗口中。而代码智能体很早就发现,这种方式完全无法实现规模扩展。与之相反,代码智能体会把内容写入文件,在需要时重新读取,并始终维护一个持久化的工作空间。
这套模式让智能体能够处理数小时甚至数天级的长周期任务,而非仅能完成秒级响应的简单操作。智能体的所有操作都会被持久化留存,且支持全程回溯。这就是你的可审计层,也是智能体落地生产环境的硬性要求。
同时,这套模式还具备极强的成本优势:你可以用廉价的存储资源,替代昂贵的推理算力。既然能把内容写入文件,又何必把所有东西都塞进上下文窗口里?
授权难题
代码智能体在沙盒内运行,沙盒就是它的信任边界。但当一个智能体需要发送邮件、修改 CRM 记录,或是查询生产数据库时,你就需要一套完全不同的信任边界体系。这就是智能体授权难题 —— 也是当你把智能体从演示 demo 推向生产环境时,第一个会失效崩溃的环节。
智能体的授权逻辑,与人工授权有着本质区别。人工授权是交互式的,而智能体授权需要以程序化、规模化的方式,处理 OAuth 流程、token 管理、权限范围管控与全链路可审计能力。
静态 API 密钥完全无法满足需求。这类密钥权限过高、不针对特定用户,且不具备可审计性。你真正需要的,是动态、限定权限范围、面向特定用户的令牌,它能在特定场景下,精准代表对应用户的授权权限。当有上千名用户各自运行专属智能体时,这套基础设施不是可选项,而是核心刚需。
两大主流模式正在形成
当前生产环境中,有两种模式已实现全行业普及:
- 员工型智能体:拥有独立的身份、专属的权限和明确的角色,作为一等主体接入你的系统,可承担销售代表、客服专员、数据分析师等职能。
- 助手型智能体:代表特定用户开展工作,使用该用户的权限执行操作。它是用户能力的延伸,而非独立的实体。
这两种模式将长期共存。你的授权基础设施必须同时兼容两种模式,否则两者都无法稳定支撑。
深度工作智能体
我最看好的模式,是深度工作智能体 —— 它能在数小时甚至数天内,持续处理复杂的多步骤任务。你只需向它下达需求,它便会自主推进执行,仅在需要人工输入时同步进度,最终交付完整结果。
这正是代码智能体模式普适性最直观的体现。深度工作智能体同样需要工作空间、持久化能力、工具调用能力和迭代执行能力,区别仅在于使用的工具不同。它们不用编译器和文件系统,取而代之的可能是 CRM 和消息平台。上下文管理的逻辑也完全一致:把早期对话内容存入工作空间,用全新的上下文窗口持续推进任务。
生产级技术栈
要在生产环境中稳定运行智能体,需要一套完整的技术栈支撑。你需要智能体运行时,来管理执行流程、系统状态、中断处理、外部系统的授权访问,以及全流程治理管控;你需要一套服务发现协议,目前模型上下文协议(MCP)已经成为该领域的行业标准,不过生产环境落地,仍需要额外的运行时层来实现授权与治理能力;你需要全链路可观测性,确保每一步操作都可追踪;如果你的服务对象是企业客户,还需要支持本地化部署、虚拟私有云(VPC)部署,以及满足合规要求的部署方案。
做一个效果惊艳的演示 demo 轻而易举,而真正落地到生产环境,需要配齐以上所有能力。绝大多数团队,都卡在了这个从 demo 到生产的鸿沟里。
安全是分层防御体系
如何防止智能体失控?答案和打造可信代码智能体的逻辑完全一致——分层防护。限定范围的权限,能约束智能体的操作边界;授权机制,能确保工具仅能执行用户有权限操作的行为;人工介入环节,能对高风险操作进行管控;可观测性,能让你掌握全链路运行行为。那工作空间的作用是什么?它就是你的完整审计追踪链路。没有什么神奇的黑科技,靠的就是层层设防的防护体系。
智能体范式正在全领域普及
智能体的核心架构难题,已经基本被代码智能体攻克。工作空间模式、上下文管理、工具编排、迭代执行 —— 这些核心能力都具备极强的普适性。剩下的工作,就是在此之上搭建生产级的运行时基础设施:授权体系、身份管理、可审计能力、可观测性、部署方案。
能够承担完整团队工作(销售、运营、数据分析)的智能体,其底层架构和如今的代码智能体完全一致。这并非遥远的未来,核心模式已经成型。剩下的,就是企业级能力层的建设:授权、身份、可审计性、部署能力。而这,正是我们 Arcade.dev 正在打造的核心产品。
郭奕婷|译







