Microsoft Azure 將 OpenAI GPT-4 和 GPT-35-Turbo 模型的可用性擴展到更多區域

閱讀時間圖標 2分鐘讀


讀者幫助支持 MSpoweruser。如果您透過我們的連結購買,我們可能會獲得佣金。 工具提示圖標

請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 阅读更多

微軟Azure OpenAI服務徽標

微軟昨天 宣布 Azure OpenAI 服務的擴展可用性。 通過此次擴展,澳大利亞東部、加拿大東部、美國東部 2、日本東部和英國南部的客戶將能夠訪問流行的 OpenAI 模型 GPT-4 和 GPT-35-Turbo。 在此擴展之前,Azure OpenAI 服務已在美國東部、法國中部、美國中南部和西歐推出。 在最近的財報電話會議上,微軟宣布 Azure OpenAI 服務現已為超過 11,000 名客戶提供服務,平均每天吸引 100 名新客戶。

今天,微軟還宣布全面推出 Azure ND H100 v5 虛擬機 (VM) 系列,該系列採用最新的 NVIDIA H100 Tensor Core GPU 和 NVIDIA Quantum-2 InfiniBand 網絡。 這個新的VM系列專為AI工作負載而設計,現已在美國東部和美國中南部Azure區域推出。 儘管虛擬機已普遍可用,但客戶必須註冊他們對訪問新虛擬機的興趣。

ND H100 v5 VM 包括以下功能:

  • 這些虛擬機配備了 100 個 NVIDIA HXNUMX Tensor Core GPU,有望比前幾代產品顯著加快 AI 模型性能。
  • 第四代英特爾至強可擴展處理器作為這些虛擬機的基礎,可確保最佳處理速度。
  • NVIDIA Quantum-2 ConnectX-7 InfiniBand 每個 GPU 為 400Gb/s,每個虛擬機的跨節點帶寬為 3.2 Tb/s,可確保跨 GPU 的無縫性能,與全球高性能超級計算機的功能相匹配。
  • 憑藉 PCIe Gen5 為每個 GPU 提供 64GB/s 的帶寬,Azure 在 CPU 和 GPU 之間實現了顯著的性能優勢。
  • DDR5 內存是這些虛擬機的核心,可提供更高的數據傳輸速度和效率,使其成為具有較大數據集的工作負載的理想選擇。
  • 與前幾代的 FP8 相比,使用新的 8 位 FP16 浮點數據類型時,矩陣乘法運算的速度提高了六倍。
  • BLOOM 175B 等大型語言模型的端到端模型推理速度提高了兩倍,展示了它們進一步優化 AI 應用程序的潛力。

有關主題的更多資訊: 天藍, Azure OpenAI 服務, 微軟