Cloudflare Workers AI：在全球网络上运行机器学习推理

Cloudflare Workers AI 概述

什么是 Cloudflare Workers AI？

Cloudflare Workers AI 是一个 Serverless AI 平台，允许开发者直接在 Cloudflare 的全球网络上运行机器学习推理任务。这意味着您可以将 AI 应用程序部署到更靠近用户的位置，从而实现更快的性能和更低的延迟。它无需复杂的架构设置，使 AI 集成到您的应用程序中变得更加容易和经济高效。

Cloudflare Workers AI 如何工作？

Cloudflare Workers AI 利用 Cloudflare Workers 平台在 Cloudflare 全球网络上分布的 NVIDIA GPU 上执行 AI 模型。这允许运行生成式 AI 任务，而无需额外的设置。

主要功能包括：

GPU 上的 Serverless AI：在 NVIDIA GPU 的全球网络上运行 AI 模型。
预训练模型：从 Llama-2、Whisper 和 ResNet50 等热门模型目录中进行选择。
全球可用性：通过 REST API 从 Workers、Pages 或任何服务访问 AI 模型。
向量数据库集成：使用 Vectorize 生成和存储嵌入，以增强 AI 工作流程。
AI Gateway：通过缓存、速率限制和分析来提高可靠性和可扩展性。
多云训练：使用 R2 进行经济高效、无出口数据存储，以用于多云训练架构。

如何使用 Cloudflare Workers AI？

选择模型：根据您的需求（例如，文本生成、图像分类、语音识别）从 Workers AI 目录中选择一个预训练模型。
与 Workers 集成：在您的 Cloudflare Worker 中使用 Workers AI API 将数据发送到模型并接收推理结果。
全球部署： Cloudflare 会自动将其 AI 应用程序分发到其全球网络，从而确保全球用户的低延迟。

示例用例：

图像分类：识别图像中的对象或场景。
情感分析：确定文本的情感（正面、负面、中性）。
语音识别：将音频转换为文本。
文本生成：生成具有创造性的文本内容。
翻译：将文本从一种语言翻译成另一种语言。

为什么选择 Cloudflare Workers AI？

低延迟：在更靠近用户的位置运行 AI 模型，以获得更快的响应时间。
可扩展性： Cloudflare 的全球网络会自动扩展以处理增加的需求。
成本效益：按需付费的定价无需前期基础设施投资。该平台在开始计费前提供 1 万个免费的每日神经元。
易于使用：简化的设置以及与其他 Cloudflare 服务的集成简化了 AI 开发。
增强的控制和保护： AI Gateway 在 LLM 应用程序中增加了一层控制和保护，允许您应用速率限制和缓存来保护后端基础设施并避免意外账单。
经济高效的训练：使用 R2 的无出口存储使 LLM 训练的多云架构变得经济实惠。

Cloudflare Workers AI 适用于哪些人？

Cloudflare Workers AI 非常适合希望以下目的的开发者和企业：

将 AI 集成到他们的 Web 应用程序中，而无需管理复杂的架构。
向世界各地的用户提供快速、低延迟的 AI 体验。
高效且经济高效地扩展他们的 AI 应用程序。

客户成功案例：

SiteGPT.ai 的创始人 Bhanu Teja Pachipulusu 表示：

"我们使用 Cloudflare 来处理所有事情 – 存储、缓存、队列，最重要的是用于训练数据和在边缘部署应用程序，因此我可以确保产品可靠且快速。它也是最经济实惠的选择，竞争对手一天的请求费用高于 Cloudflare 一个月的费用。"

"Cloudflare Workers AI"的最佳替代工具

NVIDIA

85 0

NVIDIA 是 AI 计算领域的全球领导者，通过其 GPU 和 AI 平台推动各行各业的进步。探索用于数据中心、汽车、机器人等领域的 AI 解决方案。

AI计算

GPU

深度学习

Nebius

156 0

Nebius 是一个旨在普及 AI 基础设施的 AI 云平台，提供灵活的架构、经过测试的性能和长期价值，配备 NVIDIA GPU 和优化的集群，用于训练和推理。

AI云平台

GPU计算

ThirdAI

180 0

ThirdAI 是一个在 CPU 上运行的 GenAI 平台，提供具有增强的安全性、可扩展性和性能的企业级 AI 解决方案。它简化了 AI 应用程序的开发，减少了对专用硬件和技能的需求。

CPU上的GenAI

企业AI

Phala Cloud

133 0

Phala Cloud 提供了一个无信任的开源云基础设施，用于部署 AI 代理和 Web3 应用程序，由 TEE 提供支持。它确保隐私、可扩展性，并由代码管理。

机密计算

TEE

AI 代理

BrainHost VPS

146 0

BrainHost VPS 提供高性能 KVM 虚拟服务器，配备 NVMe 存储，适用于 AI 推理、网站和电商。香港和美西 30 秒快速部署，确保可靠的全球访问。

KVM虚拟化

AI推理托管

NVMe存储

Runpod

291 0

Runpod是一个AI云平台，简化了AI模型的构建和部署。为AI开发人员提供按需GPU资源、无服务器扩展和企业级正常运行时间。

GPU云计算

AI模型部署

AIStocks.io

233 0

AIStocks.io是一个AI驱动的股票研究平台，提供实时预测、自动化交易信号和全面的风险管理工具，助力自信的投资决策。

股票预测

算法交易

投资分析

Text With History

153 0

Text With History 是一款 AI 聊天机器人应用，让历史重现生机。通过与世界各地的历史人物进行启发性对话。

历史AI聊天

虚拟历史导师

Coconaut

220 0

创建像 ChatGPT 一样由您的数据驱动的聊天机器人。Coconaut 让您通过训练网站、PDF 或知识库快速构建自定义 AI 聊天机器人，实现无缝客户互动。

自定义聊天机器人构建器

数据训练AI

Nebius AI Studio Inference Service

209 0

Nebius AI Studio Inference Service 提供托管开源模型，实现比专有 API 更快、更便宜、更准确的推理结果。无需 MLOps，即可无缝扩展，适用于 RAG 和生产工作负载。

AI推理

开源大语言模型

低延迟服务

DeepClaude

218 0

DeepClaude 是一个开源工具，融合 DeepSeek R1 的高级推理与 Claude 的创造力，实现无缝 AI 代码生成。享受零延迟响应、隐私保护和可定制 API——无需注册。

代码理解

双AI集成

流式API

DeepSeek V3

327 0

免费在线试用DeepSeek V3，无需注册。这个强大的开源AI模型拥有671B参数，支持商业使用，并通过浏览器演示或GitHub本地安装提供无限访问。

大语言模型

开源LLM

671B参数

SaladCloud

472 0

SaladCloud 提供经济高效、安全且社区驱动的分布式 GPU 云，用于 AI/ML 推理。节省高达 90% 的计算成本。非常适合 AI 推理、批量处理等。

GPU 云

AI 推理

分布式计算

Conva.AI

351 0

Conva.AI是一个全栈平台，使企业能够轻松地将AI体验添加到移动和Web应用程序中，而无需专门的DS/ML团队。提供超越聊天机器人的AI。

AI助手平台

无代码AI

添加到收藏夹

编辑收藏

Cloudflare Workers AI