Microsoft dévoile la boîte à outils « PyRIT » pour aider à protéger les systèmes d'IA générative

Icône de temps de lecture 2 minute. lis


Les lecteurs aident à prendre en charge MSpoweruser. Nous pouvons recevoir une commission si vous achetez via nos liens. Icône d'info-bulle

Lisez notre page de divulgation pour savoir comment vous pouvez aider MSPoweruser à soutenir l'équipe éditoriale En savoir plus

Notes clés

  • Le géant du logiciel présente un cadre open source pour permettre aux professionnels de la sécurité de localiser de manière proactive les vulnérabilités dans les modèles d'IA.

Microsoft Pyrite

Microsoft aujourd'hui annoncé la sortie de PyRIT (Python Risk Identification Toolkit), un cadre d'automatisation open source qui permet aux équipes de sécurité d'identifier les risques au sein des systèmes d'IA générative. Cette décision souligne l'engagement profond de Microsoft en faveur du développement responsable de l'IA et de la création d'outils sécurisés pour le paysage de l'IA générative en expansion rapide.

Automatisation de l'IA Red Teaming : une nécessité

Le Red Teaming, le processus de simulation d’attaques pour tester les défenses, est crucial pour l’IA générative. Cependant, ces systèmes sont complexes, avec de multiples points de défaillance, contrairement aux logiciels traditionnels. La vaste expérience de Microsoft en matière de red teaming en matière d'IA a conduit à la création de PyRIT, répondant aux défis uniques posés par l'IA générative.

"Bien que l'automatisation ne puisse pas remplacer complètement les équipes rouges humaines, elle est essentielle pour intensifier les efforts et mettre en évidence les domaines nécessitant une enquête plus approfondie", a déclaré Microsoft.

PyRIT : fonctionnalités et avantages clés

  • Adaptabilité: Fonctionne avec divers modèles d'IA génératifs et peut être étendu pour prendre en charge de nouveaux types d'entrée (par exemple, images, vidéo).
  • Ensembles de données axés sur les risques : Permet de tester à la fois les problèmes de sécurité et les biais ou inexactitudes potentiels.
  • Moteur de notation flexible : Permet d'évaluer les résultats de l'IA à l'aide de l'apprentissage automatique ou de LLM directs pour l'auto-test.
  • Stratégies d'attaque à plusieurs tours : Simule des attaques plus réalistes et persistantes pour des tests approfondis.
  • Capacité de mémoire: Facilite l’analyse et permet des interactions plus longues et plus complexes.

Impact à l’échelle de l’industrie

La sortie de PyRIT devrait faire des vagues dans le secteur de la sécurité de l'IA. Microsoft encourage les organisations de tous secteurs à utiliser PyRIT dans leurs efforts de sécurité de l'IA générative. L’entreprise invite également à la collaboration, soulignant qu’un effort concerté est crucial pour construire des défenses solides contre les risques émergents de l’IA.

Il est important de noter que PyRIT ne remplace pas l’équipe rouge manuelle des systèmes d’IA générative. Au lieu de cela, il augmente l'expertise du domaine existant d'une équipe rouge d'IA et automatise les tâches fastidieuses pour eux. 

Vous pouvez démarrer avec le projet PyRIT ici

En savoir plus sur les sujets : Sécurité IA, IA générative, microsoft, open-source, PyrIT, Équipe rouge

Soyez sympa! Laissez un commentaire

Votre adresse email n'apparaitra pas. Les champs obligatoires sont marqués *