当前位置：首页 > news >正文

用于扩展微软Azure OpenAI 服务工作负载的全球预置托管部署

news 2025/4/26 18:11:05

Azure OpenAI 服务在 AI 部署方面取得了重大进展：全球预配托管部署，现已于 2024 年 9 月 18 日正式推出 (GA)。此次发布标志着我们致力于让全球客户更易于访问、可扩展和灵活地使用 AI 的一个重要里程碑，我们将在 8 月份发布用于自助区域部署的预配吞吐量单元 (PTU) 的基础上继续努力。

博客文章缩略图 1，标题为“宣布全球预置托管部署以扩展 Azure OpenAI 服务工作负载”

参考内容：免费试用Azure OpenAI

什么是全球配置管理？

全球预配托管是 Azure OpenAI 服务中的一种新部署类型，它利用 Azure 的全球基础设施更有效地服务预配流量。它支持最新的 GPT-4o (2024-08-06) 和 GPT-4o-mini (2024-07-18) 模型，使客户可以不受区域特定配额或容量限制地访问它们。这种新的部署模型使客户能够将 AI 功能扩展到全球任何角落，从而为部署模型提供更大的灵活性和速度。

双重可用性：全球和区域

我们还很高兴地宣布，GPT-4o (2024-08-06) 模型现在不仅可通过全球预置托管部署获得，还可通过自助服务获得预置区域部署。这意味着客户可以根据自己的特定需求和偏好，灵活地选择全球托管部署模型或更可控的区域特定部署方法。

全球配置托管部署的主要优势

随处访问最新模型：全球预配托管部署模型消除了区域限制，允许客户在所有受支持的 Azure 区域（包括 eastus、westeurope、japaneast 等）访问最新的 AI 模型，如 GPT-4o 和 GPT-4o-mini。
简化部署和管理：与传统部署方法不同，Global Provisioned Managed 将容量管理与特定区域分离，让所有符合条件的客户自动获得新的全球配额。
数据驻留和合规性灵活性：虽然 API 流量可以在全球范围内处理，但所有客户数据都安全地存储在 Azure OpenAI 服务资源的区域中，确保遵守区域数据驻留和合规性要求。
透明且灵活的定价：全球预配置托管的计费遵循与现有预配置托管部署相同的模型，确保可预测的成本，并提供按小时定价和预留选项，以适应不同的使用场景。
双重部署选项，实现更大灵活性： GPT-4o 模型可用于全球配置管理和配置区域部署，使客户可以自由选择最适合其组织需求的部署策略。

为何选择 Global Provisioned Managed？

这种新的部署类型代表了我们人工智能方法的重大发展，它具有以下特点：

全球影响力：在任何地方部署人工智能模型，不受区域配额或容量的限制。
成本效益：受益于成本管理选项，包括每月和每年的预订。
增强的灵活性：以更少的复杂性和管理负担更快地部署和扩展 AI 解决方案，让您更加专注于创新。
区域控制：对于需要特定区域部署的客户，GPT-4o 模型仍然可通过自助服务获得，从而实现对容量管理的完全控制。

如何开始

在全球或区域范围内部署你的 AI 模型非常简单：

对于全球预配托管部署：此选项将于 2024 年 9 月 18 日起在您的 Azure OpenAI 服务区域资源中提供。要使用它，请创建或选择现有的区域资源，然后选择“全球预配托管部署”选项。
对于预配置的区域部署： GPT -4o（2024-08-06）模型可用于自助服务区域部署，让您可以灵活地根据需要管理区域容量和资源。