A Google Gemini MI-je megbotlik a képgenerálásban, fejlesztést ígér
2 perc olvas
Publikálva
Olvassa el közzétételi oldalunkat, hogy megtudja, hogyan segítheti az MSPowerusert a szerkesztői csapat fenntartásában Tovább
Főbb megjegyzések
- Az ellentmondásos képkimenetek rávilágítanak a nagy nyelvi modellek pontosságának és sokféleségének egyensúlyban tartásával kapcsolatos kihívásokra.
Google elismerte a Gemini AI képgeneráló eszköz hiányosságai, miután a funkció pontatlan és potenciálisan káros képeket készített az emberekről. A vállalat ideiglenesen felfüggesztette a funkciót, amíg a javításon dolgozik. A vita abból adódott, hogy a Gemini hajlamos változatos képeket készíteni, még akkor is, ha a felhasználók konkrét történelmi alakokat vagy forgatókönyveket kértek. Noha az átfogónak szánták, ez történelmileg pontatlan és néha sértő eredményekhez vezetett.
Prabhakar Raghavan rangidős alelnök egy blogbejegyzésében elmagyarázta a félrelépéseket, és megfogadta, hogy javítja a technológiát. „Nem akartuk, hogy az Ikrek megtagadják egy adott csoport képeinek létrehozását… [de] hibákat követ el” – írta.
Íme, mi történt rosszul a Google Geminivel:
- A Google hangolása annak biztosítására, hogy a Gemini egy sor embert mutasson be, nem vette figyelembe azokat az eseteket, amelyeknek egyértelműen meg kell lenniük nem mutat egy tartományt.
- Az idő múlásával a modell sokkal óvatosabbá vált, mint gondoltuk, és bizonyos kérdésekre nem volt hajlandó teljes mértékben válaszolni – tévesen értelmezett néhány nagyon anódos felszólítást érzékenynek.
- Ez a két dolog arra késztette a modellt, hogy bizonyos esetekben túlkompenzálja, más esetekben pedig túlságosan konzervatív, ami zavarba ejtő és helytelen képekhez vezetett.
Az AI képgenerálás kihívásai:
Ez az incidens rávilágít az AI képgenerálási modellekben a pontosság és a reprezentáció egyensúlyának folyamatos kihívására. A Google küzdelmei hasonló vitákat tükröznek más népszerű képgenerátorokkal.