OpenAI constate que les évaluateurs humains GPT-4 aidés par CriticGPT surpassent leurs homologues non IA
OpenAI est ouvert aux critiques
2 minute. lis
Publié le
Lisez notre page de divulgation pour savoir comment vous pouvez aider MSPoweruser à soutenir l'équipe éditoriale En savoir plus.
Notes clés
- Le nouveau CriticGPT d'OpenAI, basé sur GPT-4, critique le code de ChatGPT pour aider les formateurs humains.
- Il améliore les performances du formateur de 60 % par rapport aux évaluations non assistées.
- Les critiques CriticGPT sont préférées 63 % du temps à celles de ChatGPT en raison de moins de pinaillages et d'hallucinations.
Peu de temps après avoir publié le Application de bureau ChatGPT sur macOS, OpenAI vient de lancer un énième modèle. C'est appelé CritiqueGPT, basé sur GPT-4, et il vous permet d'identifier et de critiquer les erreurs dans les sorties de code du chatbot IA populaire pour aider les formateurs humains lors des commentaires.
La société soutenue par Microsoft explique que les entraîneurs humains assistés par CriticGPT ont pu surpasser de 60 % leurs homologues non assistés. Mais malgré la réduction des problèmes hallucinés, CriticGPT a encore besoin de quelques critiques, notamment lors de la gestion de tâches complexes et d'erreurs dispersées.
Une IA sait certainement comment s'automatiser, mais des évaluateurs humains sont toujours nécessaires, c'est pourquoi même Google dit toujours explicitement que ils utilisent des évaluateurs humains pour examiner comment l'IA est utilisée dans la section historique de navigation de Chrome.
Ainsi, de la même manière que ChatGPT est formé, CriticGPT apprend également grâce aux commentaires humains, en se concentrant sur la détection des erreurs délibérément insérées dans le code généré par ChatGPT. Les formateurs en IA ont ensuite évalué la capacité de CriticGPT à détecter ces erreurs intentionnelles et ces bugs naturels détectés par d'autres formateurs.
Les résultats ont montré que les critiques de CriticGPT étaient préférées à celles de ChatGPT dans 63 % des cas pour les bugs naturels, car elles généraient moins de pinailles et d'hallucinations inutiles.
« Dans nos recherches sur CriticGPT, nous avons constaté que l’application du RLHF au GPT-4 promet d’aider les humains à produire de meilleures données RLHF pour le GPT-4. Nous prévoyons d’étendre davantage ce travail et de le mettre en pratique », promet OpenAI.
Forum des utilisateurs
Messages 0