OpenAI finder, at GPT-4 menneskelige anmeldere hjulpet af CriticGPT klarer sig bedre end ikke-AI modparter

OpenAI er åben for kritik

Hjem » Nyheder

Ikon for læsetid 2 min. Læs

Kalenderikon Udgivet den 28. Juni, 2024

by Rafly Gilang

offentliggjort den 28. Juni, 2024

Del denne artikel

Forbedre denne vejledning

Læsere hjælper med at understøtte MSpoweruser. Vi får muligvis en kommission, hvis du køber via vores links.

Nøgle noter

OpenAIs nye CriticGPT, baseret på GPT-4, kritiserer ChatGPTs kode for at hjælpe menneskelige trænere.
Det forbedrer trænerens ydeevne med 60 % sammenlignet med ikke-assisterede anmeldelser.
CriticGPT-kritik foretrækkes 63% af tiden frem for ChatGPT'er på grund af færre nitpicks og hallucinationer.

Ikke for længe efter udgivelsen ChatGPT desktop app på macOS har OpenAI netop lanceret endnu en model. Det hedder Kritik GPT, baseret på GPT-4, og det lader dig identificere og kritisere fejl i den populære AI-chatbots kodeoutput for at hjælpe menneskelige trænere under feedback.

Det Microsoft-støttede firma forklarer, at CriticGPT-støttede menneskelige trænere var i stand til at overgå deres uassisterede modparter med 60 %. Men stadigvæk, på trods af reduktionen af hallucinerede problemer, har CriticGPT stadig brug for en vis kritik, især når man håndterer komplekse opgaver og spredte fejl.

En AI ved helt sikkert, hvordan man automatiserer sig selv, men der er stadig brug for menneskelige anmeldere, det er derfor, selv Google stadig udtrykkeligt siger, at de bruger menneskelige anmeldere for at gennemgå, hvordan AI bruges i browserhistoriksektionen i Chrome.

Så ligesom ChatGPT trænes, lærer CriticGPT også gennem menneskelig feedback, med fokus på at opdage fejl, der bevidst er indsat i kode genereret af ChatGPT. AI-trænere evaluerede derefter CriticGPT's evne til at finde disse tilsigtede fejl og naturligt forekommende fejl fanget af andre trænere.

Resultaterne viste, at CriticGPT's kritik blev foretrukket frem for ChatGPT's i 63% af tilfældene for naturligt forekommende fejl, da det genererede færre uhensigtsmæssige nitpicks og hallucinationer.

"I vores forskning om CriticGPT fandt vi ud af, at anvendelse af RLHF på GPT-4 lover at hjælpe mennesker med at producere bedre RLHF-data for GPT-4. Vi planlægger at skalere dette arbejde yderligere og omsætte det i praksis,” lover OpenAI.

Rafly Gilang

Teknisk reporter

Rafly er en reporter med mange års journalistisk erfaring, lige fra teknologi, forretning, social og kultur. Rapporterer i øjeblikket nyheder om Microsoft-relaterede produkter, teknologi og kunstig intelligens på MSPowerUser. Har du et tip? Send det til [e-mail beskyttet]

Brugerforum

0 meddelelser

Sorter efter:

Giv en kommentar Annuller svar