OpenAI מוצא שבודקי GPT-4 אנושיים בסיוע CriticGPT עולים על מקבילים שאינם בינה מלאכותית
OpenAI פתוח לביקורת
2 דקות לקרוא
פורסם ב
קרא את דף הגילויים שלנו כדי לגלות כיצד תוכל לעזור ל-MSPoweruser לקיים את צוות העריכה קראו עוד
הערות עיקריות
- ה-CriticGPT החדש של OpenAI, המבוסס על GPT-4, מבקר את הקוד של ChatGPT כדי לסייע למאמנים אנושיים.
- זה משפר את ביצועי המאמן ב-60% בהשוואה לביקורות ללא סיוע.
- ביקורת CriticGPT מועדפת ב-63% מהזמן על פני ChatGPT בגלל פחות עצלות והזיות.
לא יותר מדי זמן לאחר שחרור ה אפליקציית ChatGPT לשולחן העבודה ב-macOS, OpenAI השיקה דגם נוסף. זה נקרא ביקורת GPT, המבוסס על GPT-4, והוא מאפשר לך לזהות ולבקר שגיאות בפלטות הקוד של הצ'אטבוט הפופולרי של AI כדי לעזור למאמנים אנושיים במהלך משוב.
החברה הנתמכת על ידי מיקרוסופט מסבירה כי מאמנים אנושיים בסיוע CriticGPT הצליחו לעלות על מקביליהם ללא סיוע ב-60%. אבל, עדיין, למרות הפחתת הבעיות ההזויות, CriticGPT עדיין זקוקה לביקורת מסוימת, במיוחד בעת טיפול במשימות מורכבות ושגיאות מפוזרות.
AI בהחלט יודע להפוך את עצמו לאוטומטי, אבל עדיין דרושים סוקרים אנושיים, זו הסיבה שאפילו גוגל עדיין אומרת את זה במפורש הם משתמשים בבודקים אנושיים כדי לסקור כיצד נעשה שימוש ב-AI בקטע היסטוריית הגלישה של Chrome.
אז, בדומה לאופן שבו ChatGPT מאומן, CriticGPT לומד גם באמצעות משוב אנושי, תוך התמקדות באיתור שגיאות שהוכנסו בכוונה לקוד שנוצר על ידי ChatGPT. מאמני בינה מלאכותית העריכו אז את היכולת של CriticGPT למצוא את השגיאות המכוונות הללו ואת הבאגים המתרחשים באופן טבעי שנתפסו על ידי מאמנים אחרים.
התוצאות הראו כי הביקורות של CriticGPT הועדפו על פני ChatGPT ב-63% מהמקרים עבור באגים טבעיים, שכן היא יצרה פחות עצלות והזיות לא מועילות.
"במחקר שלנו על CriticGPT, מצאנו שליישום RLHF ל-GPT-4 יש הבטחה לעזור לבני אדם לייצר נתוני RLHF טובים יותר עבור GPT-4. אנחנו מתכננים להרחיב את העבודה הזו ולהוציא אותה לפועל", מבטיח OpenAI.
פורום משתמשים
0 הודעות