Microsoft está desarrollando su propio modelo de lenguaje a gran escala con 500 mil millones de parámetros

Icono de tiempo de lectura 1 minuto. leer


Los lectores ayudan a respaldar a MSpoweruser. Es posible que obtengamos una comisión si compra a través de nuestros enlaces. Icono de información sobre herramientas

Lea nuestra página de divulgación para descubrir cómo puede ayudar a MSPoweruser a sostener el equipo editorial. Leer más

Notas clave

  • La creación de MAI-1 indica la determinación de Microsoft de reducir su dependencia de OpenAI para los modelos de IA.

A través de su sólida asociación con OpenAI, Microsoft ya aprovecha uno de los principales modelos de lenguajes grandes (LLM) de la industria. Más allá de las ofertas de OpenAI, Microsoft Research lanza constantemente modelos de lenguaje más pequeños (SLM) para seguir siendo competitivo con las nuevas empresas de IA y los proyectos de código abierto. Ahora, la información informes que Microsoft está creando su propio LLM interno, cuyo nombre en código es MAI-1.

Aunque se cree que familia de modelos phi fue entrenado con un máximo de 14 mil millones de parámetros, MAI-1 utilizará aproximadamente 500 mil millones de parámetros. Esto posiciona a MAI-1 para rivalizar directamente con los LLM líderes en la industria como Google Gemini y Amazon Titan.

Mustafa Suleyman, quien recientemente se unió a Microsoft lidera el esfuerzo para desarrollar MAI-1. Además de contratar a Mustafa y miembros clave de Inflection AI, Microsoft también firmó el acceso a la tecnología de Inflection. Por lo tanto, es posible que Microsoft esté utilizando parte de la tecnología que adquirió de Inflection para desarrollar MAI-1.

Esta noticia de desarrollo de MAI-1 indica que Microsoft claramente no quiere depender completamente de OpenAI para los modelos de IA. Quiere tener acceso a los modelos de IA de última generación de OpenAI, MAI-1 desarrollado internamente que tendrá capacidades equivalentes a los modelos de última generación de OpenAI y a la familia Phi de modelos pequeños para escenarios en dispositivos. .