El modelo o1 de OpenAI ahora impulsa ChatGPT y también estará disponible para usuarios gratuitos
La compañía también planea llevar el o1-mini a los usuarios gratuitos.
2 minuto. leer
Publicado el
Lea nuestra página de divulgación para descubrir cómo puede ayudar a MSPoweruser a sostener el equipo editorial. Más información
Notas clave
- OpenAI lanzó OpenAI o1, un modelo de razonamiento que impulsa ChatGPT.
- El o1 es más preciso pero más lento y más caro que los modelos anteriores.
- Está disponible para usuarios Plus, Team y próximamente Edu y Enterprise.
OpenAI tiene ha lanzado su primer modelo para habilidades de razonamiento, el OpenAI o1, y llegará para impulsar el popular chatbot ChatGPT.
El último modelo, junto con el OpenAI o1-mini, más pequeño y económico, es el primero de una nueva serie de modelos de “razonamiento” diseñados para manejar tareas complejas, como codificación y resolución de problemas de varios pasos. Si bien es más preciso y capaz que los modelos anteriores, o1 es más lento y más costoso de usar y aún tiene algunos problemas con las alucinaciones.
“Tanto o1-preview como o1-mini se pueden seleccionar manualmente en el selector de modelos y, en el lanzamiento, los límites de frecuencia semanales serán de 30 mensajes para o1-preview y 50 para o1-mini. Estamos trabajando para aumentar esas frecuencias y permitir que ChatGPT elija automáticamente el modelo correcto para un mensaje determinado”, afirma la empresa respaldada por Microsoft.
OpenAI o1 será el motor de ChatGPT. Los usuarios de las cuentas Plus y Team ya pueden probar el modelo, y los usuarios de Enterprise y Edu podrán hacerlo la semana que viene. La empresa también tiene previsto ofrecer el o1-mini a los usuarios gratuitos, aunque no se ha anunciado la fecha exacta.
Comparado con el anterior Modelo GPT-4o, o1, que obtiene un 78.2% en el índice de referencia MMLU, supera a este último en 54 de las 57 subcategorías del índice de referencia a pesar de un puntaje general del 82.0%.
También supera ampliamente a GPT-4o en áreas como matemáticas, donde resolvió el 74% de los problemas en AIME (en comparación con el 4% de GPT-12o), e incluso superó a expertos de nivel de doctorado en GPQA Diamond, un punto de referencia en química, física y biología.
Foro de usuarios
mensajes de 0