Windows Server 2025 和 Azure Stack HCI 24H2 可改善 AI 工作負載管理
2分鐘讀
發表於
請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 閱讀更多
重點說明
- Windows Server 2025 和 Azure Stack HCI 24H2 改善了對 NVIDIA GPU 上的 AI 工作負載的支援。
- 離散設備分配允許將整個 GPU 分配給虛擬機,以實現故障轉移叢集中的高可用性。
- GPU 分割區允許將單一 GPU 分割為獨立的分割區,以實現高效率的資源利用。
- 即時遷移可確保硬體維護或升級期間人工智慧工作負載不間斷。
Microsoft 宣布 Windows Server 2025 和 Azure Stack HCI 24H2 中即將推出的功能,以改善對 AI 工作負載的支持 利用 NVIDIA GPU。
這些更新可以為企業在管理伺服器上的人工智慧任務時提供更重要的控制和靈活性。該公告的一個關鍵點是對 NVIDIA GPU 的高級支持,它允許執行訓練、學習和推理複雜 AI 模型等任務。
即將發布的版本還引入了 離散設備分配 (DDA) 故障轉移集群中的功能。這有助於將整個 GPU 分配給各個虛擬機器 (VM),從而總體上為關鍵 AI 工作負載帶來高可用性。
稱為 GPU 分割區 (GPU-P) 的新功能可進一步最佳化。 GPU-P 允許將單一實體 GPU 劃分為多個隔離的分割區。故障轉移群集中的每個虛擬機器都可以分配自己的分區,從而最大限度地提高資源利用率,從而形成更具成本效益的解決方案。
包括即時遷移功能,以確保維護或升級期間不間斷運作。分配了 GPU 分割區的虛擬機器可以跨叢集節點遷移,而不會影響正在進行的工作負載。
Windows 管理中心 (WAC) 可作為管理虛擬化 GPU 的集中平台。管理員可以使用WAC查看、配置GPU分區並將其分配給虛擬機,從而簡化管理任務。
Microsoft 與 NVIDIA 的持續合作,現已成為 全球第二大最有價值的公司,確保這些功能符合業界安全標準。這使得企業能夠有效率地運作人工智慧工作負載。
更多 這裡.
使用者論壇
0消息