微軟推出「PyRIT」工具包以協助保護生成式人工智慧系統

閱讀時間圖標 2分鐘讀


讀者幫助支持 MSpoweruser。如果您透過我們的連結購買,我們可能會獲得佣金。 工具提示圖標

請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 阅读更多

重點說明

  • 軟體巨頭推出開源框架,使安全專業人員能夠主動定位人工智慧模型中的漏洞。

微軟Pyrit

微軟今天 宣布 PyRIT(Python 風險識別工具包)的發布,這是一個開源自動化框架,使安全團隊能夠識別生成人工智慧系統中的風險。此舉突顯了微軟對負責任的人工智慧開發和為快速擴展的生成式人工智慧領域建立安全工具的堅定承諾。

AI 紅隊自動化:必需品

紅隊是模擬攻擊來測試防禦的過程,對於產生人工智慧至關重要。然而,與傳統軟體不同,這些系統很複雜,存在多個故障點。 Microsoft 在 AI 紅隊方面的豐富經驗促成了 PyRIT 的創建,以解決生成式 AI 帶來的獨特挑戰。

微軟表示:“雖然自動化無法完全取代人類紅隊隊員,但它對於擴大工作規模和突出需要更深入調查的領域至關重要。”

PyRIT:主要特性與優點

  • 適應性: 可與各種生成式 AI 模型搭配使用,並可擴充以支援新的輸入類型(例如影像、影片)。
  • 以風險為中心的資料集: 能夠測試安全問題和潛在的偏差或不準確。
  • 靈活的評分引擎: 允許使用機器學習或直接法學碩士進行自我測試對人工智慧輸出進行評分。
  • 多回合攻擊策略: 模擬更真實、持續的攻擊以進行深入測試。
  • 記憶能力: 促進分析並允許更長、更複雜的交互作用。

全行業的影響

PyRIT 的發布必將在人工智慧安全產業掀起波瀾。 Microsoft 鼓勵跨部門的組織在其生成式 AI 安全工作中利用 PyRIT。該公司還邀請合作,強調共同努力對於建立針對新興人工智慧風險的強大防禦至關重要。

值得注意的是,PyRIT 並不能取代生成式 AI 系統的手動紅隊。相反,它增強了人工智慧紅隊成員現有的領域專業知識,並為他們自動執行繁瑣的任務。 

您可以開始使用 PyRIT 項目 請點擊這裡

有關主題的更多資訊: 人工智能安全, 生成AI, 微軟, 開放源碼, 皮瑞特, 紅隊