OpenAI finder, at GPT-4 menneskelige anmeldere hjulpet af CriticGPT klarer sig bedre end ikke-AI modparter

OpenAI er åben for kritik

Ikon for læsetid 2 min. Læs


Læsere hjælper med at understøtte MSpoweruser. Vi får muligvis en kommission, hvis du køber via vores links. Værktøjstip-ikon

Læs vores oplysningsside for at finde ud af, hvordan du kan hjælpe MSPoweruser med at opretholde redaktionen Læs mere

Nøgle noter

  • OpenAIs nye CriticGPT, baseret på GPT-4, kritiserer ChatGPTs kode for at hjælpe menneskelige trænere.
  • Det forbedrer trænerens ydeevne med 60 % sammenlignet med ikke-assisterede anmeldelser.
  • CriticGPT-kritik foretrækkes 63% af tiden frem for ChatGPT'er på grund af færre nitpicks og hallucinationer.
OpenAI

Ikke for længe efter udgivelsen ChatGPT desktop app på macOS har OpenAI netop lanceret endnu en model. Det hedder Kritik GPT, baseret på GPT-4, og det lader dig identificere og kritisere fejl i den populære AI-chatbots kodeoutput for at hjælpe menneskelige trænere under feedback.

Det Microsoft-støttede firma forklarer, at CriticGPT-støttede menneskelige trænere var i stand til at overgå deres uassisterede modparter med 60 %. Men stadigvæk, på trods af reduktionen af ​​hallucinerede problemer, har CriticGPT stadig brug for en vis kritik, især når man håndterer komplekse opgaver og spredte fejl.

En AI ved helt sikkert, hvordan man automatiserer sig selv, men der er stadig brug for menneskelige anmeldere, det er derfor, selv Google stadig udtrykkeligt siger, at de bruger menneskelige anmeldere for at gennemgå, hvordan AI bruges i browserhistoriksektionen i Chrome.

Så ligesom ChatGPT trænes, lærer CriticGPT også gennem menneskelig feedback, med fokus på at opdage fejl, der bevidst er indsat i kode genereret af ChatGPT. AI-trænere evaluerede derefter CriticGPT's evne til at finde disse tilsigtede fejl og naturligt forekommende fejl fanget af andre trænere.

Resultaterne viste, at CriticGPT's kritik blev foretrukket frem for ChatGPT's i 63% af tilfældene for naturligt forekommende fejl, da det genererede færre uhensigtsmæssige nitpicks og hallucinationer.

"I vores forskning om CriticGPT fandt vi ud af, at anvendelse af RLHF på GPT-4 lover at hjælpe mennesker med at producere bedre RLHF-data for GPT-4. Vi planlægger at skalere dette arbejde yderligere og omsætte det i praksis,” lover OpenAI.

Brugerforum

0 meddelelser