Microsoft trenował Phi-3 Mini tylko przez tydzień z przyjaznymi AI procesorami graficznymi H100 firmy Nvidia

Wersja Mini Phi-3 jest jedynym obecnie dostępnym modelem

Ikona czasu czytania 2 minuta. czytać


Czytelnicy pomagają wspierać MSpoweruser. Możemy otrzymać prowizję, jeśli dokonasz zakupu za pośrednictwem naszych linków. Ikona podpowiedzi

Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej

Kluczowe uwagi

  • Microsoft wypuścił na rynek modele Phi-3, na czele z Phi-3 Mini o parametrach 3.8B,
  • Model został wytrenowany na 3.3 biliona tokenów w siedem dni przy użyciu 512 procesorów graficznych NVIDIA H100.
  • Rodzina Phi-3 obejmuje również warianty Small i Medium, przewyższające poprzednie modele, takie jak Phi-2.

Microsoft uruchomił Rodzina Phi-3 modeli, jeden z najlepszych małych modeli dostępnych obecnie na rynku. A teraz Nvidia powiedziany i opisał, jak firma z Redmond wykorzystała swoje procesory graficzne H100 do trenowania tych modeli, a dokładniej wersji Mini, 3.8B.

„Model ma 3.8 miliarda parametrów i został przeszkolony na 3.3 biliona tokenów w zaledwie siedem dni na 512 procesorach graficznych NVIDIA H100 Tensor Core” – mówi we wtorek twórca technologii. 

Rodzina Phi-3 obejmuje trzy warianty: Phi-3 Mini (3.8B), Phi-3 Small (7B) i Phi-3 Medium (14B). To ogromna poprawa w porównaniu z poprzednią wersją Phi-2 który został wprowadzony na rynek z parametrami zaledwie 2.7 miliarda miesięcy temu. 

Mówiąc dokładniej, Phi-3 Mini ma również dwie opcje w zależności od obsługiwanych tokenów: 4K i 128K. Możesz wypróbować tę drugą opcję w centrum AI Nvidii jako usługę Nvidia NIM dla programistów i uruchomić model lokalnie za pomocą Windows DirectML lub TensorRT-LLM.

„Modele Phi-3 znacznie przewyższają modele językowe o tych samych i większych rozmiarach w kluczowych testach porównawczych (patrz liczby testów porównawczych poniżej, im więcej, tym lepiej)” Microsoft powiedziany podczas wprowadzania modeli na rynek, przechwalając się, że wersje Small i Medium mogą przewyższać większe modele, takie jak GPT-3.5T. 

Wersja Mini jest obecnie dostępna na rynku, ale Microsoft obiecał, że wszystkie pozostałe dwa modele będą dostępne wkrótce. Możesz także wypróbować Phi-3 Mini na platformie Azure AI i Przytulanie twarzy.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *