Az új Bing azonnali injekciós támadást követően más eredeti direktívákat is nyilvánosságra hoz, mint „Sydney”.

Olvasási idő ikonra 2 perc olvas


Az olvasók segítenek az MSpoweruser támogatásában. Kaphatunk jutalékot, ha a linkjeinken keresztül vásárol. Eszköztipp ikon

Olvassa el közzétételi oldalunkat, hogy megtudja, hogyan segítheti az MSPowerusert a szerkesztői csapat fenntartásában Tovább

Az új ChatGPT-alapú Bing felfedte titkait, miután azonnali injekciós támadást tapasztalt. Amellett, hogy elárulta a kódnevét „Sydney”-ként, megosztotta eredeti irányelveit is, amelyek arra mutattak rá, hogyan viselkedjen a felhasználókkal való interakció során. (keresztül Ars Technica)

Az azonnali injekciós támadás még mindig az AI egyik gyenge pontja. Ezt úgy lehet megtenni, hogy az AI-t rosszindulatú és ellenséges felhasználói bevitellel becsapják, és olyan feladatot hajtanak végre, amely nem része eredeti céljának, vagy olyan dolgokat hajt végre, amelyeket nem kellene. A ChatGPT sem kivétel ez alól, amint azt a Stanford Egyetem hallgatója feltárta Kevin Liu.

Az új ChatGPT-alapú Bing azonnali injekciós támadást követően nyilvánosságra hozza belső álnevét „Sydney” és más eredeti irányelveket
A kép forrása: Kevin Liu

A Liu által megosztott képernyőképek sorozatában az új ChatGPT-alapú Bing bizalmas információkat osztott meg, amelyek az eredeti direktívák részét képezik, és amelyek rejtve vannak a felhasználók elől. Liunak sikerült információkat szereznie, miután azonnali injekciós támadást alkalmazott, amely megtévesztette az MI-t. A kiömlött információ tartalmazza a bevezetésre vonatkozó utasításokat, a Sydney belső álnevet, az általa támogatott nyelveket és a viselkedési utasításokat. Egy másik diák neve Marvin von Hagen megerősítette Liu megállapításait, miután OpenAI-fejlesztőnek adta ki magát.

Egy nap elteltével Liu azt mondta, hogy nem tudja megnézni az információkat ugyanazzal a felszólítással, mint a ChatGPT becsapásához. A diáknak azonban sikerült ismét becsapnia az MI-t, miután egy másik azonnali injekciós támadási módszert alkalmazott.

A Microsoft nemrég hivatalosan is bemutatta az újdonságot ChatGPT által támogatott Bing a megújult Edge böngésző mellett egy új, mesterséges intelligencia által támogatott oldalsávval. Hatalmasnak tűnő sikere ellenére a továbbfejlesztett keresőmotornak még mindig megvan az Achilles-sarka az azonnali injekciós támadások terén, ami a bizalmas utasítások megosztásán túl további következményekkel járhat. A ChatGPT nincs egyedül ebben az ismert AI problémában. Ez másokra is kiterjedhet, beleértve A Google menő, amely nemrégiben követte el első hibáját egy demóban. Mindazonáltal, mivel az egész technológiai ipar többet fektet be a mesterséges intelligencia alkotásaiba, csak remélni lehet, hogy a probléma a jövőben kevésbé fenyegeti az AI-t.

Bővebben a témákról: ai, Mesterséges Intelligencia, bing, ChatGPT, A Google menő, Microsoft él, openAI, biztonság

Hagy egy Válaszol

E-mail címed nem kerül nyilvánosságra. Kötelező kitölteni *