Anthropic 平台进化:从 API 到托管 Agent 架构
Anthropic 平台负责人 Angela 和 Caitlin 深入探讨了 Claude 平台的演进逻辑,从简单的补全接口转向具备状态感知的托管 Agent 架构。
- Managed Agents 核心能力:提供内置的 Python 运行环境、文件系统访问以及处理长期运行(Async)任务的基础设施。
- 模块化 Skill 设计:将文件操作、Vault 凭据管理、网络搜索等作为可插拔的原子能力,降低开发者的“工程脚手架”负担。
- 性能突破:最新的 Claude Mythos 预览版在 METR 基准测试中展现出极强的长时程处理能力,成功率指标领先次优模型 2 倍以上。
- 范式转移:Anthropic 工程师 Thariq 提出 HTML 正在取代 Markdown 成为 AI 协作的新标准,通过 Claude Code 生成 HTML 可实现更丰富的交互展示。
目前的平台演进正处于从“通用黑盒”向“模型与环境深度耦合”的过渡期。开发者在构建 Agent 时常面临“模型微调”与“环境工程”的权衡。
Anthropic 的策略是通过原生集成文件系统和安全沙箱,将过去需要数千行 Python 代码实现的逻辑压缩为平台级调用。这种深度集成带来了明显的路径依赖。
模型不再仅仅是推理机,而是被训练为熟练操作特定系统原语(Primitives)的执行者。这意味着模型性能的提升不仅来自参数规模,更来自对平台工具链的熟悉度。
Anthropic 内部所有第一方产品(如 Claude Code)均构建在同一套公共平台上,这种“吃自家狗粮”的模式确保了平台能力与前沿需求的同步。未来的竞争将集中在结果验证(Verifiable Outcomes)上。
平台的目标是让用户只需定义“结果”与“预算”,由 Agent 自主完成子任务拆解、模型选择及环境部署。这将彻底改变传统通过提示词工程进行微调的低效模式。