用于扩展 微软Azure OpenAI 服务工作负载的全球预置托管部署
Azure OpenAI 服务在 AI 部署方面取得了重大进展:全球预配托管部署,现已于 2024 年 9 月 18 日正式推出 (GA)。此次发布标志着我们致力于让全球客户更易于访问、可扩展和灵活地使用 AI 的一个重要里程碑,我们将在 8 月份发布用于自助区域部署的预配吞吐量单元 (PTU) 的基础上继续努力。
参考内容:免费试用Azure OpenAI
什么是全球配置管理?
全球预配托管是 Azure OpenAI 服务中的一种新部署类型,它利用 Azure 的全球基础设施更有效地服务预配流量。它支持最新的 GPT-4o (2024-08-06) 和 GPT-4o-mini (2024-07-18) 模型,使客户可以不受区域特定配额或容量限制地访问它们。这种新的部署模型使客户能够将 AI 功能扩展到全球任何角落,从而为部署模型提供更大的灵活性和速度。
双重可用性:全球和区域
我们还很高兴地宣布,GPT-4o (2024-08-06) 模型现在不仅可通过全球预置托管部署获得,还可通过自助服务获得预置区域部署。这意味着客户可以根据自己的特定需求和偏好,灵活地选择全球托管部署模型或更可控的区域特定部署方法。
全球配置托管部署的主要优势
- 随处访问最新模型:全球预配托管部署模型消除了区域限制,允许客户在所有受支持的 Azure 区域(包括 eastus、westeurope、japaneast 等)访问最新的 AI 模型,如 GPT-4o 和 GPT-4o-mini。
- 简化部署和管理:与传统部署方法不同,Global Provisioned Managed 将容量管理与特定区域分离,让所有符合条件的客户自动获得新的全球配额。
- 数据驻留和合规性灵活性:虽然 API 流量可以在全球范围内处理,但所有客户数据都安全地存储在 Azure OpenAI 服务资源的区域中,确保遵守区域数据驻留和合规性要求。
- 透明且灵活的定价:全球预配置托管的计费遵循与现有预配置托管部署相同的模型,确保可预测的成本,并提供按小时定价和预留选项,以适应不同的使用场景。
- 双重部署选项,实现更大灵活性: GPT-4o 模型可用于全球配置管理和配置区域部署,使客户可以自由选择最适合其组织需求的部署策略。
为何选择 Global Provisioned Managed?
这种新的部署类型代表了我们人工智能方法的重大发展,它具有以下特点:
- 全球影响力:在任何地方部署人工智能模型,不受区域配额或容量的限制。
- 成本效益:受益于成本管理选项,包括每月和每年的预订。
- 增强的灵活性:以更少的复杂性和管理负担更快地部署和扩展 AI 解决方案,让您更加专注于创新。
- 区域控制:对于需要特定区域部署的客户,GPT-4o 模型仍然可通过自助服务获得,从而实现对容量管理的完全控制。
如何开始
在全球或区域范围内部署你的 AI 模型非常简单:
- 对于全球预配托管部署:此选项将于 2024 年 9 月 18 日起在您的 Azure OpenAI 服务区域资源中提供。要使用它,请创建或选择现有的区域资源,然后选择“全球预配托管部署”选项。
- 对于预配置的区域部署: GPT -4o(2024-08-06)模型可用于自助服务区域部署,让您可以灵活地根据需要管理区域容量和资源。
展望未来:更多模式和地区
我们首次推出的全球预置托管包括对 GPT-4o 和 GPT-4o-mini 型号的支持,并计划在此部署类型下扩展更多型号的可用性。对于需要特定区域支持的用户,现有的预置托管部署仍然可用。
利用 Azure OpenAI 服务拥抱 AI 的未来
Azure OpenAI 服务致力于突破 AI 功能的界限。借助新的全球预配托管部署,我们正在打破障碍,提供更大的灵活性,并确保我们的客户可以在世界任何地方充分利用 AI 的潜力。