什么是 agent?
agent 是一种能够通过决定工具使用和流程走向来自主执行任务的 AI 系统。与遵循预定义路径的传统自动化不同,agent 可以根据上下文与中间结果动态调整自己的策略。agent 也不同于 co-pilot(如传统聊天应用),它能够完全自动化一项任务,而不只是辅助和扩展人类的输入。
- Agents → 非线性、非确定性(每次运行可能不同)
- Workflows → 线性、确定性的执行路径
- Co-pilots → 增强型 AI 辅助,需要人为介入
示例:预订度假行程
如果你是第一次接触 agent,这个例子展示了 agent 在度假预订场景中是如何工作的。
设想你打算预订一次度假。你需要研究航班、寻找酒店、查看餐厅评价,并跟踪预算。
传统的 workflow 自动化
传统的自动化系统遵循预定的顺序:
- 接收特定的输入(日期、地点、预算)
- 按固定顺序调用预定义的 API 端点
- 基于硬编码的标准返回结果
- 遇到意外情况无法适应
AI Co-pilot
co-pilot 充当一个智能助手,它能够:
- 基于你的偏好提供酒店与行程建议
- 理解并回答自然语言查询
- 给出指引与建议
- 但执行仍需要人来做决策与采取行动
Agent
agent 把 AI 做出判断的能力与调用相关工具执行任务的能力结合起来。它的输出是非确定性的,因为:
- 实时的可用性与价格变化
- 对约束的动态优先级排序
- 能够从失败中恢复
- 基于中间结果的自适应决策
agent 可以动态生成行程并完成预订,跟你期望的旅行社做的差不多。
agent 系统的组成部分
agent 系统通常有三个主要组件:
- 决策引擎:通常是一个 LLM(大语言模型),用于决定行动步骤
- 工具集成:agent 可以使用的 API、函数与服务 —— 通常通过 MCP
- 记忆系统:维持上下文并跟踪任务进度
agent 的工作方式
agent 在一个持续的循环中运行:
- 观察 当前的状态或任务
- 规划 要采取的行动,借助 AI 进行推理
- 执行 这些行动,使用可用的工具
- 学习 从结果中(将结果存入记忆、更新任务进度,并为下一轮做准备)
在 Cloudflare 上构建 agent
Cloudflare Agents SDK 为构建生产级 agent 提供基础设施:
- 持久状态 —— 每个 agent 实例都有自己的 SQLite 数据库,用于存储上下文与记忆
- 实时同步 —— 状态变化通过 WebSocket 自动广播到所有连接的客户端
- 休眠 —— agent 闲时入睡,需时唤醒,你只为实际使用付费
- 全球边缘部署 —— agent 在 Cloudflare 网络上靠近用户运行
- 内置能力 —— 调度、任务队列、workflow、邮件处理等等
后续步骤
Quick start 用 10 分钟构建你的第一个 agent。
Agents API Agents SDK 完整 API 参考。
Using AI models 集成 OpenAI、Anthropic 与其他提供商。