Η Microsoft αποκαλύπτει την εργαλειοθήκη «PyRIT» για να βοηθήσει στη διαφύλαξη των συστημάτων Generative AI

Εικονίδιο ώρας ανάγνωσης 2 λεπτό. ανάγνωση

Εικονίδιο ημερολογίου Δημοσιεύθηκε στις Φεβρουάριος 23, 2024

Δημοσιεύθηκε στις Φεβρουάριος 23, 2024

Οι αναγνώστες βοηθούν στην υποστήριξη του MSpoweruser. Ενδέχεται να λάβουμε προμήθεια εάν αγοράσετε μέσω των συνδέσμων μας.

Βασικές σημειώσεις

Ο γίγαντας λογισμικού εισάγει πλαίσιο ανοιχτού κώδικα για να επιτρέψει στους επαγγελματίες ασφαλείας να εντοπίζουν προληπτικά τις ευπάθειες σε μοντέλα τεχνητής νοημοσύνης.

Η Microsoft σήμερα ανακοίνωσε την κυκλοφορία του PyRIT (Python Risk Identification Toolkit), ενός πλαισίου αυτοματισμού ανοιχτού κώδικα που εξουσιοδοτεί τις ομάδες ασφαλείας να εντοπίζουν κινδύνους μέσα σε συστήματα παραγωγής τεχνητής νοημοσύνης. Η κίνηση υπογραμμίζει τη βαθιά δέσμευση της Microsoft για υπεύθυνη ανάπτυξη τεχνητής νοημοσύνης και δημιουργία ασφαλών εργαλείων για το ταχέως αναπτυσσόμενο τοπίο της γενετικής τεχνητής νοημοσύνης.

AI Red Teaming Automation: A Necessity

Η κόκκινη ομαδοποίηση, η διαδικασία προσομοίωσης επιθέσεων για τη δοκιμή άμυνας, είναι ζωτικής σημασίας για τη γενετική τεχνητή νοημοσύνη. Ωστόσο, αυτά τα συστήματα είναι πολύπλοκα, με πολλαπλά σημεία αστοχίας, σε αντίθεση με το παραδοσιακό λογισμικό. Η εκτεταμένη εμπειρία της Microsoft στο AI red teaming οδήγησε στη δημιουργία του PyRIT, αντιμετωπίζοντας τις μοναδικές προκλήσεις που θέτει η γενετική τεχνητή νοημοσύνη.

«Ενώ ο αυτοματισμός δεν μπορεί να αντικαταστήσει πλήρως τους ανθρώπους με κόκκινο teamers, είναι απαραίτητος για την κλιμάκωση των προσπαθειών και την ανάδειξη περιοχών που απαιτούν βαθύτερη έρευνα», δήλωσε η Microsoft.

PyRIT: Βασικά χαρακτηριστικά και πλεονεκτήματα

Ικανότητα προσαρμογής: Λειτουργεί με διάφορα μοντέλα παραγωγής τεχνητής νοημοσύνης και μπορεί να επεκταθεί για να υποστηρίζει νέους τύπους εισόδου (π.χ. εικόνες, βίντεο).
Σύνολα δεδομένων με επίκεντρο τον κίνδυνο: Επιτρέπει τη δοκιμή τόσο για ζητήματα ασφάλειας όσο και για πιθανές προκαταλήψεις ή ανακρίβειες.
Ευέλικτη μηχανή βαθμολογίας: Επιτρέπει τη βαθμολόγηση των εξόδων AI χρησιμοποιώντας μηχανική εκμάθηση ή απευθείας LLM για αυτοέλεγχο.
Στρατηγικές επίθεσης πολλαπλών στροφών: Προσομοιώνει πιο ρεαλιστικές, επίμονες επιθέσεις για εις βάθος δοκιμές.
Δυνατότητα μνήμης: Διευκολύνει την ανάλυση και επιτρέπει μεγαλύτερες, πιο σύνθετες αλληλεπιδράσεις.

Αντίκτυπος σε όλη τη βιομηχανία

Η κυκλοφορία του PyRIT πρόκειται να προκαλέσει κύματα στη βιομηχανία ασφάλειας AI. Η Microsoft ενθαρρύνει οργανισμούς σε όλους τους τομείς να χρησιμοποιούν το PyRIT στις προσπάθειές τους για την ασφάλεια τεχνητής νοημοσύνης. Η εταιρεία καλεί επίσης τη συνεργασία, τονίζοντας ότι μια συντονισμένη προσπάθεια είναι ζωτικής σημασίας για την οικοδόμηση ισχυρών άμυνων έναντι των αναδυόμενων κινδύνων τεχνητής νοημοσύνης.

Είναι σημαντικό να σημειωθεί ότι το PyRIT δεν αντικαθιστά τη χειροκίνητη κόκκινη ομαδοποίηση των παραγωγικών συστημάτων AI. Αντίθετα, αυξάνει την υπάρχουσα τεχνογνωσία ενός συνεργάτη AI red teamer και αυτοματοποιεί τις κουραστικές εργασίες για αυτούς.

Μπορείτε να ξεκινήσετε με το έργο PyRIT εδώ.

Περισσότερα για τα θέματα: Ασφάλεια AI, γενετική AI, microsoft, ανοικτού κώδικα, PyRIT, Κόκκινη ομαδοποίηση

Pradeep Viswav

Ειδικός Λογισμικού και Υπηρεσιών

Ο Pradeep είναι Πτυχιούχος Επιστήμης Υπολογιστών και Μηχανικών Υπολογιστών. Ήταν επίσης φοιτητής της Microsoft. Αυτή τη στιγμή εργάζεται σε κορυφαία εταιρεία πληροφορικής.

Αφήστε μια απάντηση