当前位置: 首页 > news >正文

用于扩展 微软Azure OpenAI 服务工作负载的全球预置托管部署

Azure OpenAI 服务在 AI 部署方面取得了重大进展:全球预配托管部署,现已于 2024 年 9 月 18 日正式推出 (GA)。此次发布标志着我们致力于让全球客户更易于访问、可扩展和灵活地使用 AI 的一个重要里程碑,我们将在 8 月份发布用于自助区域部署的预配吞吐量单元 (PTU) 的基础上继续努力。
 

博客文章缩略图 1,标题为“宣布全球预置托管部署以扩展 Azure OpenAI 服务工作负载”


参考内容:免费试用Azure OpenAI

什么是全球配置管理?

全球预配托管是 Azure OpenAI 服务中的一种新部署类型,它利用 Azure 的全球基础设施更有效地服务预配流量。它支持最新的 GPT-4o (2024-08-06) 和 GPT-4o-mini (2024-07-18) 模型,使客户可以不受区域特定配额或容量限制地访问它们。这种新的部署模型使客户能够将 AI 功能扩展到全球任何角落,从而为部署模型提供更大的灵活性和速度。


双重可用性:全球和区域

我们还很高兴地宣布,GPT-4o (2024-08-06) 模型现在不仅可通过全球预置托管部署获得,还可通过自助服务获得预置区域部署。这意味着客户可以根据自己的特定需求和偏好,灵活地选择全球托管部署模型或更可控的区域特定部署方法。


全球配置托管部署的主要优势

 

  1. 随处访问最新模型:全球预配托管部署模型消除了区域限制,允许客户在所有受支持的 Azure 区域(包括 eastus、westeurope、japaneast 等)访问最新的 AI 模型,如 GPT-4o 和 GPT-4o-mini。
  2. 简化部署和管理:与传统部署方法不同,Global Provisioned Managed 将容量管理与特定区域分离,让所有符合条件的客户自动获得新的全球配额。
  3. 数据驻留和合规性灵活性:虽然 API 流量可以在全球范围内处理,但所有客户数据都安全地存储在 Azure OpenAI 服务资源的区域中,确保遵守区域数据驻留和合规性要求。
  4. 透明且灵活的定价:全球预配置托管的计费遵循与现有预配置托管部署相同的模型,确保可预测的成本,并提供按小时定价和预留选项,以适应不同的使用场景。
  5. 双重部署选项,实现更大灵活性: GPT-4o 模型可用于全球配置管理和配置区域部署,使客户可以自由选择最适合其组织需求的部署策略。


为何选择 Global Provisioned Managed?

这种新的部署类型代表了我们人工智能方法的重大发展,它具有以下特点:

  • 全球影响力:在任何地方部署人工智能模型,不受区域配额或容量的限制。
  • 成本效益:受益于成本管理选项,包括每月和每年的预订。
  • 增强的灵活性:以更少的复杂性和管理负担更快地部署和扩展 AI 解决方案,让您更加专注于创新。
  • 区域控制:对于需要特定区域部署的客户,GPT-4o 模型仍然可通过自助服务获得,从而实现对容量管理的完全控制。


如何开始

在全球或区域范围内部署你的 AI 模型非常简单:

  • 对于全球预配托管部署:此选项将于 2024 年 9 月 18 日起在您的 Azure OpenAI 服务区域资源中提供。要使用它,请创建或选择现有的区域资源,然后选择“全球预配托管部署”选项。
  • 对于预配置的区域部署: GPT -4o(2024-08-06)模型可用于自助服务区域部署,让您可以灵活地根据需要管理区域容量和资源。


展望未来:更多模式和地区

我们首次推出的全球预置托管包括对 GPT-4o 和 GPT-4o-mini 型号的支持,并计划在此部署类型下扩展更多型号的可用性。对于需要特定区域支持的用户,现有的预置托管部署仍然可用。


利用 Azure OpenAI 服务拥抱 AI 的未来

Azure OpenAI 服务致力于突破 AI 功能的界限。借助新的全球预配托管部署,我们正在打破障碍,提供更大的灵活性,并确保我们的客户可以在世界任何地方充分利用 AI 的潜力。


http://www.mrgr.cn/news/36042.html

相关文章:

  • GIT:如何查找已删除的文件的历史记录
  • Rocky linux8 安装php8.0
  • 数据分析丨世界杯冠军猜想:EA 体育游戏模拟能成功预测吗?
  • Apache ECharts
  • 数据库SQLite的使用
  • JSP 过滤器
  • USB Micro-A、Micro-B 插头与 Micro-AB、Micro-B 插座,及其引脚定义
  • 一文理解AXI4-lite与AXI4-stream协议
  • GEE APP:基于gee开发一个在线监测Landsat5、7、8的云量面积和百分比的可视化应用
  • 戏曲多多 1.0.6.0 专为电视端设计的戏曲与生活内容APP,同样适用于安卓手机,方便老年人使用
  • 如何在算家云搭建text-generation-webui(文本生成)
  • Python 中的时间处理
  • hexo github部署,通过域名访问你的博客
  • 要让创业者有钱赚!李彦宏百度为创业者提供最好的智能体分发渠道
  • 【游戏设计】游戏中需要管理的数据分类
  • 研一上课计划2024/9/23有感
  • 两个方法分析python打包exe
  • 双十一买什么好?五款数码好物推荐!
  • 如何优化JVM性能:调优参数技巧
  • Centos7安装nginx
  • Java 入门指南:获取对象的内存地址
  • Linux上Java项目环境安装
  • android笔记 Sqlite查询内容
  • 最精简的VScode Verilog RTL开发环境搭建教程
  • 906. 超级回文数
  • linux 下python代码获取音频文件