数据与异步地基
Pages / R2 / D1 / KV / Queues / Workflows / Pipelines
面向 AI 全栈开发者的基础设施选型指南
把边缘计算、对象存储、向量检索、模型网关、状态协调、零信任、安全与全球流量调度做成可组合的基础设施层
Cloudflare 很强于推理入口、边缘编排、RAG、Agent、访问控制、全球分发和对象/日志数据湖。但它不是模型训练 GPU 云。
Workers / Workers AI / AI Gateway / Vectorize / AI Search / Agents
把请求接入、鉴权、缓存、模型路由、向量检索、对象存储读写、日志与计费整合到一个边缘执行面。
Workers 作为中心枢纽,统一调度 AI Gateway、Vectorize、R2、D1、Queues 等下游服务。
Serverless GPU 推理,可从 Workers / Pages / API 调用。按 Neurons 计费,50+ 开源模型,全球网络就近执行。
多模型接入后如何看得见、控得住、降得下成本、顶得住异常。OpenAI 兼容接口,跨供应商统一观测。
应用/Worker 统一收口到 AI Gateway,按策略路由到不同供应商,日志与分析旁路记录。
Cloudflare 原生向量层,与 Workers AI、R2、D1 深度集成。核心定位:存检索索引,而非原始大对象。
开箱即用的 RAG:自动索引、chunking、混合检索、聊天接口。2026-04-16 起新实例含内置存储与向量索引。
AI Search = 快速上线 RAG;Vectorize = 自定义索引与检索策略。
| 场景 | AI Search | Vectorize |
|---|---|---|
| 快速上线文档问答 | 首选 | 需自建 pipeline |
| 自定义 metadata 检索 | 受限 | 完全可控 |
| 自定义索引分片 | 托管 | 可设计 |
| 多模态 embedding | 文本为主 | 支持自定义 |
| 公开端点 | 内置 | 需 Workers 包装 |
推荐:先 AI Search 验证产品,后视需要沉到 Vectorize 自定义栈。
每个 Agent 实例自带 SQLite 状态、WebSocket 同步、休眠唤醒。Durable Objects 是底层强一致原语。
Pages / R2 / D1 / KV / Queues / Workflows / Pipelines
AI 应用前端、存储与异步链路的核心组件。
Pages 前端 → Workers 编排 → 多层存储与异步链路。
训练场景最佳实践:R2 存原始数据,Catalog 做 Iceberg 目录,Pipelines 入湖,外部 GPU 训练从 R2 取数据。
原 WARP Connector,现为 Cloudflare One 私有网络组件。设备与服务器通过 Cloudflare 边缘网络互联,无需 VPN 或跳板机,内置后量子加密。
| 维度 | Cloudflare Mesh | Cloudflare Tunnel | Tailscale |
|---|---|---|---|
| 定位 | 私有网络互联 (VPN 替代) | 安全发布内部服务 | P2P Mesh VPN |
| 流量方向 | 双向,任意节点互通 | 单向入站(外部→内部) | 双向 P2P 直连 |
| 协议 | TCP / UDP / ICMP | HTTP/S, TCP, SSH, RDP | WireGuard (内核级) |
| 加密 | 后量子加密 ✦ | TLS (标准) | WireGuard (P2P 端到端) |
| 流量路径 | 经 Cloudflare 边缘中转 | 经 Cloudflare 边缘中转 | P2P 直连 (DERP 备用) |
| Split Tunnel | 细粒度控制 ✦ | 按路由规则 | Exit Node 全有或全无 |
| 零信任集成 | Gateway + Posture + Access ✦ | Access + 策略引擎 ✦ | ACL 仅 |
Cloudflare One / Access / Gateway / Turnstile / WAF
Access = 入站访问控制;Gateway = 出站流量治理。企业 AI 工具的安全前提。
AI API 暴露面的分层防御最佳实践:从人机验证到 DDoS 兜底。
请求从浏览器到 API 的完整安全过滤链路。
CDN / Load Balancing / Argo / Images / Stream / Spectrum / Magic Transit
三者组合决定 AI API 的全球交付质量:CDN 缓存静态与重复结果,LB 调度多区推理后端,Argo 优化跨区不可缓存请求。
Images/Stream 负责多模态与视频分发;Spectrum/Magic Transit 负责非 HTTP 协议与企业级网络防护。
推荐架构 / 选型决策 / 成本与合规考量
| AI 类型 | 推荐组合 | 预算敏感 | 低延迟 | 高合规 |
|---|---|---|---|---|
| 模型训练 | R2 + Catalog + Pipelines + 外部GPU | 仅 R2,不上 Catalog | 训练不看边缘时延 | Data Localization + Access/Tunnel |
| 批量推理 | Workers + Queues + Workflows + R2 + D1 | 先 Queues,后补 Workflows | Hyperdrive 连外部 DB | Gateway/Access + R2 私桶 |
| 实时推理 | Workers + AI Gateway + Workers AI/外部 + KV | 小模型 + 强缓存 | Workers AI 就近 + Argo | Access + WAF + Turnstile |
| 边缘推理 | Workers + Workers AI + Durable Objects | 减少 DO 状态管理 | 小模型 + embedding 优先 | Turnstile/WAF + Spectrum |
| 数据采集 | Turnstile + Workers + Queues + Pipelines + R2 | R2 + Queues 即可 | 高吞吐用 Pipelines | Gateway/DLP + Data Localization |
| 身份控制 | Cloudflare One + Access + Gateway + Tunnel | 从 Access/One Client 起步 | 不走传统 VPN 回传 | DLP + 日志 + 设备姿态 + Tunnel |