Microsoft'un Phi-2 2.7B modeli, yakın zamanda duyurulan Google Gemini Nano-2 3.2B modelinden daha iyi performans gösteriyor

Okuma zamanı simgesi 2 dk. okuman


Okuyucular MSpoweruser'ı desteklemeye yardımcı olur. Bağlantılarımız aracılığıyla satın alırsanız komisyon alabiliriz. Araç İpucu Simgesi

MSPoweruser'ın editör ekibini ayakta tutmasına nasıl yardımcı olabileceğinizi öğrenmek için açıklama sayfamızı okuyun. Daha fazla

Microsoft Phi-2

Geçtiğimiz birkaç ay boyunca Microsoft Research, "Phi" adı verilen bir dizi küçük dil modeli (SLM) yayınladı. Phi-1 ilk olarak 1.3 milyar parametreyle piyasaya sürüldü ve temel Python kodlaması için uzmanlaştı. Eylül ayında Microsoft Araştırma serbest Phi-1.5 modeli 1.3 milyar parametreye sahiptir ancak çeşitli NLP sentetik metinlerini içeren yeni bir veri kaynağı ile eğitilmiştir. Küçük boyutuna rağmen phi-1.5, diğer benzer boyutlu modellerle karşılaştırıldığında neredeyse son teknoloji ürünü bir performans sunuyordu.

Bugün Microsoft, 2 milyar parametreli Phi-2.7 modelinin piyasaya sürüldüğünü duyurdu. Microsoft Research, bu yeni SLM'nin 13 milyardan az parametreyle temel dil modelleri arasında en gelişmiş performansı sağladığını iddia ediyor. Bazı karmaşık kıyaslamalarda Phi-2, 25 kata kadar daha büyük modellerle eşleşir veya onlardan daha iyi performans gösterir.

Geçen hafta, Google açıkladı Gemini dil modelleri paketi. Gemini Nano, Google'ın cihaz içi görevler için oluşturulmuş en verimli modelidir ve doğrudan mobil silikon üzerinde çalışabilir. Gemini Nano benzeri küçük dil modeli, metin özetleme, bağlamsal akıllı yanıtlar ve gelişmiş düzeltme ve dilbilgisi düzeltme gibi özellikleri mümkün kılar.

Microsoft'a göre yeni Phi-2 modeli, boyutları daha küçük olmasına rağmen yeni Google Gemini Nano-2 ile eşleşiyor veya ondan daha iyi performans gösteriyor. Google Gemini Nano-2 ve Phi-2 modelleri arasındaki kıyaslama karşılaştırmasını aşağıda bulabilirsiniz.

ModelbedenbbhBoolQMBPPMMLU
İkizler Nano 23.2B42.479.327.255.8
Phi-22.7B59.383.359.156.7

Phi-2, Gemini Nano-2'den daha iyi performans göstermesinin yanı sıra, çeşitli kıyaslamalarda 2B ve 7B parametrelerinde Mistral ve Llama-13 modellerinin performansını da geride bırakıyor. Ayrıntıları aşağıda bulabilirsiniz.

ModelbedenbbhSağduyu
muhakeme
Dil
Anlamak
Matematikkodlama
Lama-27B40.062.256.716.521.0
13B47.865.061.934.225.4
70B66.569.267.664.138.3
Karayel7B57.266.463.746.439.4
Phi-22.7B59.268.862.061.153.7

Önceki iki phi modeli Hugging Face'te kullanıma sunulurken, Yunan alfabesinin yirmibirinci harfi-2 Azure model kataloğunda kullanıma sunuldu. Phi-2 hakkında daha fazla bilgi edinebilirsiniz okuyun.

Konular hakkında daha fazla bilgi: microsoft, microsoft araştırması, Phi-1, Phi-2

Yorum bırak

E-posta hesabınız yayımlanmayacak. Gerekli alanlar işaretlenmişlerdir. *