Windows Server 2025 和 Azure Stack HCI 24H2 可改善 AI 工作負載管理

主頁 » 最新消息

2分鐘讀

發表於 2024 年 6 月 7 日

發表於 2024 年 6 月 7 日

分享此文章

改進本指南

讀者幫助支持 MSpoweruser。如果您透過我們的連結購買，我們可能會獲得佣金。

重點說明

Microsoft 宣布 Windows Server 2025 和 Azure Stack HCI 24H2 中即將推出的功能，以改善對 AI 工作負載的支持利用 NVIDIA GPU。

這些更新可以為企業在管理伺服器上的人工智慧任務時提供更重要的控制和靈活性。該公告的一個關鍵點是對 NVIDIA GPU 的高級支持，它允許執行訓練、學習和推理複雜 AI 模型等任務。

即將發布的版本還引入了離散設備分配 (DDA) 故障轉移集群中的功能。這有助於將整個 GPU 分配給各個虛擬機器 (VM)，從而總體上為關鍵 AI 工作負載帶來高可用性。

稱為 GPU 分割區 (GPU-P) 的新功能可進一步最佳化。 GPU-P 允許將單一實體 GPU 劃分為多個隔離的分割區。故障轉移群集中的每個虛擬機器都可以分配自己的分區，從而最大限度地提高資源利用率，從而形成更具成本效益的解決方案。

包括即時遷移功能，以確保維護或升級期間不間斷運作。分配了 GPU 分割區的虛擬機器可以跨叢集節點遷移，而不會影響正在進行的工作負載。

Windows 管理中心 (WAC) 可作為管理虛擬化 GPU 的集中平台。管理員可以使用WAC查看、配置GPU分區並將其分配給虛擬機，從而簡化管理任務。

Microsoft 與 NVIDIA 的持續合作，現已成為全球第二大最有價值的公司，確保這些功能符合業界安全標準。這使得企業能夠有效率地運作人工智慧工作負載。

更多這裡.

德韋什·貝裡

科技記者

這些是激勵我的事情 - 創造資訊豐富且有用的內容，追求我對賽車運動和音樂的熱情，參與探險，保持健康的生活方式，以及與我可愛的貓 Taco 共度時光。

使用者論壇

0消息

排序方式：