Windows Server 2025 et Azure Stack HCI 24H2 pour améliorer la gestion de la charge de travail de l'IA

Icône de temps de lecture 2 minute. lis


Les lecteurs aident à prendre en charge MSpoweruser. Nous pouvons recevoir une commission si vous achetez via nos liens. Icône d'info-bulle

Lisez notre page de divulgation pour savoir comment vous pouvez aider MSPoweruser à soutenir l'équipe éditoriale En savoir plus.

Notes clés

  • Windows Server 2025 et Azure Stack HCI 24H2 améliorent la prise en charge des charges de travail d'IA sur les GPU NVIDIA.
  • L'attribution de périphériques discrets permet d'attribuer des GPU entiers aux machines virtuelles pour une haute disponibilité dans les clusters de basculement.
  • Le partitionnement GPU permet de diviser un seul GPU en partitions isolées pour une utilisation efficace des ressources.
  • La migration en direct garantit des charges de travail d'IA ininterrompues pendant la maintenance ou les mises à niveau du matériel.

Microsoft a annoncé les fonctionnalités à venir dans Windows Server 2025 et Azure Stack HCI 24H2 pour améliorer la prise en charge des charges de travail d'IA utilisant des GPU NVIDIA.

Ces mises à jour peuvent offrir aux entreprises un contrôle et une flexibilité plus importants lors de la gestion des tâches d'IA sur leurs serveurs. Un point clé de l'annonce est la prise en charge avancée des GPU NVIDIA, qui permet d'effectuer des tâches telles que la formation, l'apprentissage et l'inférence de modèles d'IA complexes.

Les prochaines versions introduisent également un Affectation de périphérique discret (DDA) fonctionnalité au sein des clusters de basculement. Cela facilite l'attribution de GPU entiers à des machines virtuelles (VM) individuelles, ce qui peut globalement conduire à une haute disponibilité pour les charges de travail d'IA critiques.

Une nouvelle fonctionnalité appelée GPU Partitioning (GPU-P) permet une optimisation plus poussée. GPU-P permet de diviser un seul GPU physique en plusieurs partitions isolées. Chaque machine virtuelle d'un cluster de basculement peut se voir attribuer sa propre partition, ce qui maximise l'utilisation des ressources, conduisant à une solution plus rentable.

Des fonctionnalités de migration en direct sont incluses pour garantir un fonctionnement ininterrompu pendant la maintenance ou les mises à niveau. Les machines virtuelles avec des partitions GPU attribuées peuvent migrer entre les nœuds du cluster sans impact sur les charges de travail en cours.

Le Centre d'administration Windows (WAC) sert de plate-forme centralisée pour la gestion des GPU virtualisés. Les administrateurs peuvent utiliser WAC pour afficher, configurer et attribuer des partitions GPU aux machines virtuelles, simplifiant ainsi les tâches de gestion.

La collaboration continue de Microsoft avec NVIDIA, désormais le deuxième entreprise la plus valorisée au monde, garantit que ces fonctionnalités répondent aux normes de sécurité de l'industrie. Cela permet aux entreprises d’exécuter efficacement les charges de travail d’IA.

Plus ici.

Forum des utilisateurs

Messages 0