Microsoft Azure amplía la disponibilidad de los modelos OpenAI GPT-4 y GPT-35-Turbo a más regiones
2 minuto. leer
Publicado el
Lea nuestra página de divulgación para descubrir cómo puede ayudar a MSPoweruser a sostener el equipo editorial. Más información
Microsoft ayer anunció la disponibilidad ampliada de Azure OpenAI Service. Con esta expansión, los clientes del este de Australia, el este de Canadá, el este de Estados Unidos 2, el este de Japón y el sur del Reino Unido podrán acceder a los populares modelos OpenAI GPT-4 y GPT-35-Turbo. Antes de esta expansión, Azure OpenAI Service estaba disponible en el este de Estados Unidos, el centro de Francia, el centro sur de Estados Unidos y el oeste de Europa. Durante la reciente llamada de ganancias, Microsoft anunció que Azure OpenAI Service ahora atiende a más de 11,000 clientes, atrayendo un promedio de 100 nuevos clientes diariamente.
Microsoft también anunció hoy la disponibilidad general de la serie de máquinas virtuales (VM) Azure ND H100 v5, que incluye las GPU NVIDIA H100 Tensor Core más recientes y la red NVIDIA Quantum-2 InfiniBand. Esta nueva serie de máquinas virtuales está diseñada específicamente para cargas de trabajo de IA y ahora está disponible en las regiones de Azure del este de Estados Unidos y del centro sur de Estados Unidos. Si bien las máquinas virtuales están generalmente disponibles, los clientes deben registrar su interés en acceder a las nuevas máquinas virtuales.
Las máquinas virtuales ND H100 v5 incluyen las siguientes características:
- Equipadas con ocho GPU NVIDIA H100 Tensor Core, estas máquinas virtuales prometen un rendimiento del modelo de IA significativamente más rápido que las generaciones anteriores.
- Los procesadores escalables Intel Xeon de cuarta generación como base de estas máquinas virtuales, lo que garantiza una velocidad de procesamiento óptima.
- NVIDIA Quantum-2 ConnectX-7 InfiniBand con 400 Gb/s por GPU con 3.2 Tb/s por VM de ancho de banda entre nodos garantiza un rendimiento perfecto en todas las GPU, igualando las capacidades de las supercomputadoras de mayor rendimiento a nivel mundial.
- Con PCIe Gen5 que proporciona un ancho de banda de 64 GB/s por GPU, Azure logra importantes ventajas de rendimiento entre la CPU y la GPU.
- La memoria DDR5 es el núcleo de estas máquinas virtuales y ofrece mayores velocidades de transferencia de datos y eficiencia, lo que las hace ideales para cargas de trabajo con conjuntos de datos más grandes.
- Con hasta seis veces más velocidad en las operaciones de multiplicación de matrices cuando se usa el nuevo tipo de datos de punto flotante FP8 de 8 bits en comparación con FP16 en generaciones anteriores.
- Con hasta dos veces más velocidad en modelos de lenguaje grande como la inferencia de modelo de extremo a extremo BLOOM 175B, lo que demuestra su potencial para optimizar aún más las aplicaciones de IA.
Foro de usuarios
mensajes de 0