OpenAI מוצא שבודקי GPT-4 אנושיים בסיוע CriticGPT עולים על מקבילים שאינם בינה מלאכותית

OpenAI פתוח לביקורת

עמוד הבית » חֲדָשׁוֹת

סמל זמן קריאה 2 דקות לקרוא

סמל לוח השנה פורסם ב יוני 28, 2024

by רפלי גילנג

פורסם ב יוני 28, 2024

שתף את המאמר הזה

שפר את המדריך הזה

קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו.

הערות עיקריות

ה-CriticGPT החדש של OpenAI, המבוסס על GPT-4, מבקר את הקוד של ChatGPT כדי לסייע למאמנים אנושיים.
זה משפר את ביצועי המאמן ב-60% בהשוואה לביקורות ללא סיוע.
ביקורת CriticGPT מועדפת ב-63% מהזמן על פני ChatGPT בגלל פחות עצלות והזיות.

לא יותר מדי זמן לאחר שחרור ה אפליקציית ChatGPT לשולחן העבודה ב-macOS, OpenAI השיקה דגם נוסף. זה נקרא ביקורת GPT, המבוסס על GPT-4, והוא מאפשר לך לזהות ולבקר שגיאות בפלטות הקוד של הצ'אטבוט הפופולרי של AI כדי לעזור למאמנים אנושיים במהלך משוב.

החברה הנתמכת על ידי מיקרוסופט מסבירה כי מאמנים אנושיים בסיוע CriticGPT הצליחו לעלות על מקביליהם ללא סיוע ב-60%. אבל, עדיין, למרות הפחתת הבעיות ההזויות, CriticGPT עדיין זקוקה לביקורת מסוימת, במיוחד בעת טיפול במשימות מורכבות ושגיאות מפוזרות.

AI בהחלט יודע להפוך את עצמו לאוטומטי, אבל עדיין דרושים סוקרים אנושיים, זו הסיבה שאפילו גוגל עדיין אומרת את זה במפורש הם משתמשים בבודקים אנושיים כדי לסקור כיצד נעשה שימוש ב-AI בקטע היסטוריית הגלישה של Chrome.

אז, בדומה לאופן שבו ChatGPT מאומן, CriticGPT לומד גם באמצעות משוב אנושי, תוך התמקדות באיתור שגיאות שהוכנסו בכוונה לקוד שנוצר על ידי ChatGPT. מאמני בינה מלאכותית העריכו אז את היכולת של CriticGPT למצוא את השגיאות המכוונות הללו ואת הבאגים המתרחשים באופן טבעי שנתפסו על ידי מאמנים אחרים.

התוצאות הראו כי הביקורות של CriticGPT הועדפו על פני ChatGPT ב-63% מהמקרים עבור באגים טבעיים, שכן היא יצרה פחות עצלות והזיות לא מועילות.

"במחקר שלנו על CriticGPT, מצאנו שליישום RLHF ל-GPT-4 יש הבטחה לעזור לבני אדם לייצר נתוני RLHF טובים יותר עבור GPT-4. אנחנו מתכננים להרחיב את העבודה הזו ולהוציא אותה לפועל", מבטיח OpenAI.

רפלי גילנג

כתב טכנולוגיה

רפלי הוא כתב בעל ניסיון עיתונאי של שנים, החל מטכנולוגיה, עסקים, חברתי ותרבות. כרגע מדווח על חדשות על מוצרים הקשורים למיקרוסופט, טכנולוגיה ובינה מלאכותית ב-MSPowerUser. יש טיפ? שלח את זה ל [מוגן בדוא"ל]

פורום משתמשים

0 הודעות

מיין לפי:

השאירו תגובה ביטול תגובה