Microsoft Azure 將 OpenAI GPT-4 和 GPT-35-Turbo 模型的可用性擴展到更多區域

閱讀時間圖標 2分鐘讀

日曆圖標發表於 2023 年 8 月 8 日

發表於 2023 年 8 月 8 日

讀者幫助支持 MSpoweruser。如果您透過我們的連結購買，我們可能會獲得佣金。

微軟昨天宣布 Azure OpenAI 服務的擴展可用性。通過此次擴展，澳大利亞東部、加拿大東部、美國東部 2、日本東部和英國南部的客戶將能夠訪問流行的 OpenAI 模型 GPT-4 和 GPT-35-Turbo。在此擴展之前，Azure OpenAI 服務已在美國東部、法國中部、美國中南部和西歐推出。在最近的財報電話會議上，微軟宣布 Azure OpenAI 服務現已為超過 11,000 名客戶提供服務，平均每天吸引 100 名新客戶。

今天，微軟還宣布全面推出 Azure ND H100 v5 虛擬機 (VM) 系列，該系列採用最新的 NVIDIA H100 Tensor Core GPU 和 NVIDIA Quantum-2 InfiniBand 網絡。這個新的VM系列專為AI工作負載而設計，現已在美國東部和美國中南部Azure區域推出。儘管虛擬機已普遍可用，但客戶必須註冊他們對訪問新虛擬機的興趣。

ND H100 v5 VM 包括以下功能：

這些虛擬機配備了 100 個 NVIDIA HXNUMX Tensor Core GPU，有望比前幾代產品顯著加快 AI 模型性能。
第四代英特爾至強可擴展處理器作為這些虛擬機的基礎，可確保最佳處理速度。
NVIDIA Quantum-2 ConnectX-7 InfiniBand 每個 GPU 為 400Gb/s，每個虛擬機的跨節點帶寬為 3.2 Tb/s，可確保跨 GPU 的無縫性能，與全球高性能超級計算機的功能相匹配。
憑藉 PCIe Gen5 為每個 GPU 提供 64GB/s 的帶寬，Azure 在 CPU 和 GPU 之間實現了顯著的性能優勢。
DDR5 內存是這些虛擬機的核心，可提供更高的數據傳輸速度和效率，使其成為具有較大數據集的工作負載的理想選擇。
與前幾代的 FP8 相比，使用新的 8 位 FP16 浮點數據類型時，矩陣乘法運算的速度提高了六倍。
BLOOM 175B 等大型語言模型的端到端模型推理速度提高了兩倍，展示了它們進一步優化 AI 應用程序的潛力。

有關主題的更多資訊：天藍, Azure OpenAI 服務, 微軟

普拉迪普·維斯瓦夫

軟體和服務專家

Pradeep 是電腦科學與工程專業的畢業生。他還是微軟的學生夥伴。他目前在一家領先的 IT 公司工作。