Microsoft'un Phi-2 2.7B modeli, yakın zamanda duyurulan Google Gemini Nano-2 3.2B modelinden daha iyi performans gösteriyor

Okuma zamanı simgesi 2 dk. okuman

Takvim simgesi Yayınlandı 12 Aralık 2023

yayınlandı 12 Aralık 2023

Okuyucular MSpoweruser'ı desteklemeye yardımcı olur. Bağlantılarımız aracılığıyla satın alırsanız komisyon alabiliriz.

Geçtiğimiz birkaç ay boyunca Microsoft Research, "Phi" adı verilen bir dizi küçük dil modeli (SLM) yayınladı. Phi-1 ilk olarak 1.3 milyar parametreyle piyasaya sürüldü ve temel Python kodlaması için uzmanlaştı. Eylül ayında Microsoft Araştırma serbest Phi-1.5 modeli 1.3 milyar parametreye sahiptir ancak çeşitli NLP sentetik metinlerini içeren yeni bir veri kaynağı ile eğitilmiştir. Küçük boyutuna rağmen phi-1.5, diğer benzer boyutlu modellerle karşılaştırıldığında neredeyse son teknoloji ürünü bir performans sunuyordu.

Bugün Microsoft, 2 milyar parametreli Phi-2.7 modelinin piyasaya sürüldüğünü duyurdu. Microsoft Research, bu yeni SLM'nin 13 milyardan az parametreyle temel dil modelleri arasında en gelişmiş performansı sağladığını iddia ediyor. Bazı karmaşık kıyaslamalarda Phi-2, 25 kata kadar daha büyük modellerle eşleşir veya onlardan daha iyi performans gösterir.

Geçen hafta, Google açıkladı Gemini dil modelleri paketi. Gemini Nano, Google'ın cihaz içi görevler için oluşturulmuş en verimli modelidir ve doğrudan mobil silikon üzerinde çalışabilir. Gemini Nano benzeri küçük dil modeli, metin özetleme, bağlamsal akıllı yanıtlar ve gelişmiş düzeltme ve dilbilgisi düzeltme gibi özellikleri mümkün kılar.

Microsoft'a göre yeni Phi-2 modeli, boyutları daha küçük olmasına rağmen yeni Google Gemini Nano-2 ile eşleşiyor veya ondan daha iyi performans gösteriyor. Google Gemini Nano-2 ve Phi-2 modelleri arasındaki kıyaslama karşılaştırmasını aşağıda bulabilirsiniz.

Model	beden	bbh	BoolQ	MBPP	MMLU
İkizler Nano 2	3.2B	42.4	79.3	27.2	55.8
Phi-2	2.7B	59.3	83.3	59.1	56.7

Phi-2, Gemini Nano-2'den daha iyi performans göstermesinin yanı sıra, çeşitli kıyaslamalarda 2B ve 7B parametrelerinde Mistral ve Llama-13 modellerinin performansını da geride bırakıyor. Ayrıntıları aşağıda bulabilirsiniz.

Model	beden	bbh	Sağduyu muhakeme	Dil Anlamak	Matematik	kodlama
Lama-2	7B	40.0	62.2	56.7	16.5	21.0
	13B	47.8	65.0	61.9	34.2	25.4
	70B	66.5	69.2	67.6	64.1	38.3
Karayel	7B	57.2	66.4	63.7	46.4	39.4
Phi-2	2.7B	59.2	68.8	62.0	61.1	53.7

Önceki iki phi modeli Hugging Face'te kullanıma sunulurken, Yunan alfabesinin yirmibirinci harfi-2 Azure model kataloğunda kullanıma sunuldu. Phi-2 hakkında daha fazla bilgi edinebilirsiniz okuyun.

Konular hakkında daha fazla bilgi: microsoft, microsoft araştırması, Phi-1, Phi-2

Pradeep Viswav'ı

Yazılım ve Hizmet Uzmanı

Pradeep Bilgisayar Bilimi ve Mühendisliği mezunudur. Aynı zamanda Microsoft Öğrenci Ortağıydı. Şu anda önde gelen bir bilişim şirketinde çalışmaktadır.

Yorum bırak