ONNX Runtime Web de Microsoft apporte l'IA générative au navigateur Web

Icône de temps de lecture 2 minute. lis


Les lecteurs aident à prendre en charge MSpoweruser. Nous pouvons recevoir une commission si vous achetez via nos liens. Icône d'info-bulle

Lisez notre page de divulgation pour savoir comment vous pouvez aider MSPoweruser à soutenir l'équipe éditoriale En savoir plus

Notes clés

  • L'intégration de WebGPU dans ONNX Runtime Web améliore les performances des modèles d'apprentissage automatique complexes dans les navigateurs Web.
  • WebGPU utilise le GPU de l'appareil pour une exécution plus rapide, permettant potentiellement de nouvelles applications d'IA basées sur un navigateur.
  • Cette technologie en est à ses débuts, actuellement prise en charge par les navigateurs Chrome et Edge.

ONNX Runtime Web prend désormais en charge WebGPU, une API Web qui permet l'accélération matérielle pour les modèles d'apprentissage automatique exécutés dans les navigateurs Web. ONNX Runtime Web est une bibliothèque JavaScript qui permettra aux développeurs Web de déployer des modèles d'apprentissage automatique directement dans les navigateurs Web, offrant plusieurs backends tirant parti de l'accélération matérielle. Pour l'inférence CPU, il compile le moteur CPU natif ONNX Runtime dans le backend WebAssembly (WASM). Désormais, on peut imaginer générer des images de haute qualité ou segmenter des objets en temps réel, le tout dans votre navigateur Web, sans recourir à des serveurs.

Auparavant, les modèles complexes d'apprentissage automatique, en particulier les grands modèles génératifs, ne pouvaient pas fonctionner efficacement dans les navigateurs Web en raison de leur puissance de calcul limitée. Mais WebGPU libère la puissance du GPU de votre appareil pour ces tâches, ce qui peut améliorer considérablement les performances.

WebGPU est capable de gérer des charges de travail d'apprentissage automatique plus complexes de manière plus efficace grâce à des fonctionnalités avancées telles que le shader de calcul. Sa prise en charge de la demi-précision (FP16) réduit l'utilisation de la mémoire GPU et les besoins en bande passante tout en accélérant l'arithmétique. WebGPU promet de déduire des applications d'apprentissage automatique plus efficaces et évolutives directement dans le navigateur Web en exploitant la puissance du GPU pour des tâches de calcul parallèles.

Qu'est-ce que cela signifie pour toi?

Vous pouvez désormais bénéficier d'une IA plus rapide et plus puissante dans votre navigateur grâce à des applications en temps réel telles que la génération d'images. Cela garantit que vos données restent privées et sécurisées en éliminant leur envoi aux serveurs pour traitement. 

WebGPU est désormais inclus par défaut dans Chrome 113 et Edge 113 pour Mac, Windows, ChromeOS et Chrome 121 pour Android. Assurez-vous simplement de la compatibilité du navigateur et recherchez des ressources pour l'accélération WebGPU avec ONNX Runtime Web.

Cette avancée ouvre définitivement la voie à un avenir où de puissantes capacités d’IA seront facilement disponibles et accessibles dans votre navigateur Web.

Des détails plus détaillés sont ici.

En savoir plus sur les sujets : gpu