Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

什么是 agent?

agent 是一种能够通过决定工具使用和流程走向来自主执行任务的 AI 系统。与遵循预定义路径的传统自动化不同,agent 可以根据上下文与中间结果动态调整自己的策略。agent 也不同于 co-pilot(如传统聊天应用),它能够完全自动化一项任务,而不只是辅助和扩展人类的输入。

  • Agents → 非线性、非确定性(每次运行可能不同)
  • Workflows → 线性、确定性的执行路径
  • Co-pilots → 增强型 AI 辅助,需要人为介入

示例:预订度假行程

如果你是第一次接触 agent,这个例子展示了 agent 在度假预订场景中是如何工作的。

设想你打算预订一次度假。你需要研究航班、寻找酒店、查看餐厅评价,并跟踪预算。

传统的 workflow 自动化

传统的自动化系统遵循预定的顺序:

  • 接收特定的输入(日期、地点、预算)
  • 按固定顺序调用预定义的 API 端点
  • 基于硬编码的标准返回结果
  • 遇到意外情况无法适应 Traditional workflow automation diagram

AI Co-pilot

co-pilot 充当一个智能助手,它能够:

  • 基于你的偏好提供酒店与行程建议
  • 理解并回答自然语言查询
  • 给出指引与建议
  • 但执行仍需要人来做决策与采取行动 A co-pilot diagram

Agent

agent 把 AI 做出判断的能力与调用相关工具执行任务的能力结合起来。它的输出是非确定性的,因为:

  • 实时的可用性与价格变化
  • 对约束的动态优先级排序
  • 能够从失败中恢复
  • 基于中间结果的自适应决策 An agent diagram

agent 可以动态生成行程并完成预订,跟你期望的旅行社做的差不多。

agent 系统的组成部分

agent 系统通常有三个主要组件:

  • 决策引擎:通常是一个 LLM(大语言模型),用于决定行动步骤
  • 工具集成:agent 可以使用的 API、函数与服务 —— 通常通过 MCP
  • 记忆系统:维持上下文并跟踪任务进度

agent 的工作方式

agent 在一个持续的循环中运行:

  1. 观察 当前的状态或任务
  2. 规划 要采取的行动,借助 AI 进行推理
  3. 执行 这些行动,使用可用的工具
  4. 学习 从结果中(将结果存入记忆、更新任务进度,并为下一轮做准备)

在 Cloudflare 上构建 agent

Cloudflare Agents SDK 为构建生产级 agent 提供基础设施:

  • 持久状态 —— 每个 agent 实例都有自己的 SQLite 数据库,用于存储上下文与记忆
  • 实时同步 —— 状态变化通过 WebSocket 自动广播到所有连接的客户端
  • 休眠 —— agent 闲时入睡,需时唤醒,你只为实际使用付费
  • 全球边缘部署 —— agent 在 Cloudflare 网络上靠近用户运行
  • 内置能力 —— 调度、任务队列、workflow、邮件处理等等

后续步骤

Quick start 用 10 分钟构建你的第一个 agent。

Agents API Agents SDK 完整 API 参考。

Using AI models 集成 OpenAI、Anthropic 与其他提供商。