OpenAI พบว่าผู้ตรวจสอบที่เป็นมนุษย์ GPT-4 ที่ได้รับความช่วยเหลือจาก CriticGPT มีประสิทธิภาพเหนือกว่าผู้ตรวจสอบที่ไม่ใช่ AI
OpenAI เปิดรับคำวิจารณ์
2 นาที. อ่าน
เผยแพร่เมื่อ
อ่านหน้าการเปิดเผยข้อมูลของเราเพื่อดูว่าคุณจะช่วย MSPoweruser รักษาทีมบรรณาธิการได้อย่างไร อ่านเพิ่มเติม
หมายเหตุสำคัญ
- CriticGPT ใหม่ของ OpenAI ซึ่งใช้ GPT-4 วิจารณ์โค้ดของ ChatGPT เพื่อช่วยเหลือผู้ฝึกสอนที่เป็นมนุษย์
- ช่วยเพิ่มประสิทธิภาพของผู้ฝึกสอนได้ถึง 60% เมื่อเทียบกับบทวิจารณ์ที่ไม่ได้รับความช่วยเหลือ
- การวิพากษ์วิจารณ์ของ CriticGPT เป็นที่นิยมกว่า ChatGPT ถึง 63% เนื่องจากมีข้อผิดพลาดและอาการประสาทหลอนน้อยลง
ไม่นานหลังจากปล่อยตัว. แอปเดสก์ท็อป ChatGPT บน macOS นั้น OpenAI เพิ่งเปิดตัวอีกรุ่นหนึ่ง ก็เรียกว่า นักวิจารณ์GPTอิงตาม GPT-4 และช่วยให้คุณระบุและวิจารณ์ข้อผิดพลาดในเอาต์พุตโค้ดของแชทบอท AI ยอดนิยม เพื่อช่วยผู้ฝึกสอนที่เป็นมนุษย์ในระหว่างการตอบกลับ
บริษัทที่ได้รับการสนับสนุนจาก Microsoft อธิบายว่าผู้ฝึกสอนที่เป็นมนุษย์ที่ได้รับการสนับสนุนจาก CriticGPT สามารถทำงานได้ดีกว่าผู้ฝึกสอนที่ไม่ได้รับความช่วยเหลือถึง 60% แต่ถึงกระนั้น แม้ว่าปัญหาประสาทหลอนจะลดลง แต่ CriticGPT ยังคงต้องการคำวิพากษ์วิจารณ์ โดยเฉพาะอย่างยิ่งเมื่อต้องจัดการกับงานที่ซับซ้อนและข้อผิดพลาดที่กระจัดกระจาย
AI แน่ใจว่ารู้วิธีทำให้ตัวเองเป็นอัตโนมัติ แต่ก็ยังจำเป็นต้องมีผู้ตรวจสอบที่เป็นมนุษย์ นั่นเป็นสาเหตุที่แม้แต่ Google ก็ยังพูดอย่างชัดเจนว่า พวกเขากำลังใช้ผู้ตรวจสอบที่เป็นมนุษย์ เพื่อตรวจสอบว่า AI ถูกนำมาใช้อย่างไรในส่วนประวัติการเข้าชมของ Chrome
เช่นเดียวกับวิธีการฝึกอบรม ChatGPT CriticGPT ยังเรียนรู้ผ่านความคิดเห็นของมนุษย์ โดยมุ่งเน้นที่การระบุข้อผิดพลาดที่จงใจแทรกลงในโค้ดที่สร้างโดย ChatGPT จากนั้นผู้ฝึกสอน AI จะประเมินความสามารถของ CriticGPT ในการค้นหาข้อผิดพลาดโดยเจตนาและข้อบกพร่องที่เกิดขึ้นตามธรรมชาติที่ผู้ฝึกสอนคนอื่นๆ ตรวจพบ
ผลการวิจัยพบว่าคำวิพากษ์วิจารณ์ของ CriticGPT เป็นที่นิยมมากกว่า ChatGPT ใน 63% ของกรณีข้อบกพร่องที่เกิดขึ้นตามธรรมชาติ เนื่องจากทำให้เกิดอาการ nitpicks และอาการประสาทหลอนที่ไม่เป็นประโยชน์น้อยลง
“ในการวิจัยของเราเกี่ยวกับ CriticGPT เราพบว่าการใช้ RLHF กับ GPT-4 สัญญาว่าจะช่วยให้มนุษย์สร้างข้อมูล RLHF ที่ดีขึ้นสำหรับ GPT-4 ได้ เรากำลังวางแผนที่จะขยายงานนี้เพิ่มเติมและนำไปปฏิบัติ” OpenAI สัญญา
ฟอรั่มผู้ใช้
ข้อความ 0