Microsoft hat den Phi-3 Mini nur eine Woche lang mit Nvidias KI-freundlichen H100-GPUs trainiert

Die Mini-Version des Phi-3 ist das einzige Modell, das derzeit verfügbar ist

Symbol für die Lesezeit 2 Minute. lesen


Leser unterstützen MSpoweruser. Wir erhalten möglicherweise eine Provision, wenn Sie über unsere Links kaufen. Tooltip-Symbol

Lesen Sie unsere Offenlegungsseite, um herauszufinden, wie Sie MSPoweruser dabei helfen können, das Redaktionsteam zu unterstützen Lesen Sie weiter

Wichtige Hinweise

  • Microsoft brachte Phi-3-Modelle auf den Markt, angeführt von Phi-3 Mini mit 3.8B-Parametern.
  • Das Modell wurde in sieben Tagen mit 3.3 NVIDIA H512-GPUs auf 100 Billionen Token trainiert.
  • Die Phi-3-Familie umfasst auch kleine und mittlere Varianten und übertrifft frühere Modelle wie Phi-2.

Microsoft hat die Phi-3-Familie von Modellen, eines der derzeit besten Kleinmodelle auf dem Markt. Und jetzt Nvidia sagte und beschrieb, wie das Unternehmen aus Redmond seine H100-GPUs zum Trainieren dieser Modelle, genauer gesagt der Mini-3.8B-Version, nutzte.

„Das Modell verfügt über 3.8 Milliarden Parameter und wurde mit 3.3 Billionen Token in nur sieben Tagen auf 512 NVIDIA H100 Tensor Core GPUs trainiert“, sagte der Technologiehersteller am Dienstag. 

Die Phi-3-Familie besteht aus drei Varianten: Phi-3 Mini (3.8B), Phi-3 Small (7B) und Phi-3 Medium (14B). Es ist eine enorme Verbesserung gegenüber dem Vorgänger Phi-2 das vor Monaten mit nur 2.7 Milliarden Parametern gestartet wurde. 

Genauer gesagt bietet Phi-3 Mini je nach unterstützten Token auch zwei Optionen: 4K und 128K. Letzteres können Sie im KI-Zentrum von Nvidia als Nvidia-NIM-Dienst für Entwickler ausprobieren und das Modell lokal mit Windows DirectML oder TensorRT-LLM ausführen.

„Phi-3-Modelle übertreffen Sprachmodelle gleicher und größerer Größe bei wichtigen Benchmarks deutlich (siehe Benchmark-Zahlen unten, höher ist besser)“, Microsoft sagte Bei der Einführung der Modelle prahlte er damit, dass die Small- und Medium-Versionen größere Modelle wie GPT-3.5T übertreffen können. 

Derzeit ist die Mini-Version auf dem Markt erhältlich, Microsoft hat jedoch versprochen, dass alle anderen beiden Modelle in Kürze verfügbar sein werden. Sie können Phi-3 Mini auch auf Azure AI und Hugging Face ausprobieren.