什么是 agent?

agent 是一种能够通过决定工具使用和流程走向来自主执行任务的 AI 系统。与遵循预定义路径的传统自动化不同,agent 可以根据上下文与中间结果动态调整自己的策略。agent 也不同于 co-pilot(如传统聊天应用),它能够完全自动化一项任务,而不只是辅助和扩展人类的输入。

Agents → 非线性、非确定性(每次运行可能不同)
Workflows → 线性、确定性的执行路径
Co-pilots → 增强型 AI 辅助,需要人为介入

示例:预订度假行程

如果你是第一次接触 agent,这个例子展示了 agent 在度假预订场景中是如何工作的。

设想你打算预订一次度假。你需要研究航班、寻找酒店、查看餐厅评价,并跟踪预算。

传统的 workflow 自动化

传统的自动化系统遵循预定的顺序:

接收特定的输入(日期、地点、预算)
按固定顺序调用预定义的 API 端点
基于硬编码的标准返回结果
遇到意外情况无法适应

AI Co-pilot

co-pilot 充当一个智能助手,它能够:

基于你的偏好提供酒店与行程建议
理解并回答自然语言查询
给出指引与建议
但执行仍需要人来做决策与采取行动

Agent

agent 把 AI 做出判断的能力与调用相关工具执行任务的能力结合起来。它的输出是非确定性的,因为:

实时的可用性与价格变化
对约束的动态优先级排序
能够从失败中恢复
基于中间结果的自适应决策

agent 可以动态生成行程并完成预订,跟你期望的旅行社做的差不多。

agent 系统的组成部分

agent 系统通常有三个主要组件:

决策引擎:通常是一个 LLM(大语言模型),用于决定行动步骤
工具集成:agent 可以使用的 API、函数与服务 —— 通常通过 MCP
记忆系统:维持上下文并跟踪任务进度

agent 的工作方式

agent 在一个持续的循环中运行:

观察当前的状态或任务
规划要采取的行动,借助 AI 进行推理
执行这些行动,使用可用的工具
学习从结果中(将结果存入记忆、更新任务进度,并为下一轮做准备)

在 Cloudflare 上构建 agent

Cloudflare Agents SDK 为构建生产级 agent 提供基础设施:

持久状态 —— 每个 agent 实例都有自己的 SQLite 数据库,用于存储上下文与记忆
实时同步 —— 状态变化通过 WebSocket 自动广播到所有连接的客户端
休眠 —— agent 闲时入睡,需时唤醒,你只为实际使用付费
全球边缘部署 —— agent 在 Cloudflare 网络上靠近用户运行
内置能力 —— 调度、任务队列、workflow、邮件处理等等

后续步骤

Quick start 用 10 分钟构建你的第一个 agent。

Agents API Agents SDK 完整 API 参考。

Using AI models 集成 OpenAI、Anthropic 与其他提供商。