Microsoft, 1 Trilyon Parameters AI kitaplığı olan DeepSpeed'in ticari markasıdır

Okuma zamanı simgesi 2 dk. okuman


Okuyucular MSpoweruser'ı desteklemeye yardımcı olur. Bağlantılarımız aracılığıyla satın alırsanız komisyon alabiliriz. Araç İpucu Simgesi

MSPoweruser'ın editör ekibini ayakta tutmasına nasıl yardımcı olabileceğinizi öğrenmek için açıklama sayfamızı okuyun. Daha fazla

derin hız

Microsoft, büyük ölçekli yapay zeka modellerinin mütevazı donanımlarda eğitilmesine olanak tanıyan optimize edilmiş yapay zeka kitaplıkları olan DeepSpeed ​​için bir ticari marka başvurusunda bulundu.

8 Aralık 2020'de açılan ticari marka, “Yapay zeka işleme ve derin öğrenme için çevrimiçi indirilemeyen bilgisayar yazılımlarının geçici olarak kullanılmasını sağlamak,Microsoft, DeepSpeed'i çevrimiçi bir bulut hizmeti aracılığıyla kullanılabilir hale getirmeyi düşünüyor olabilir.

Bu yıl Şubat ayında piyasaya sürülen DeepSpeed, yalnızca 800 Nvidia V100 ekran kartı kullanarak, dünyanın mevcut en büyük modeline göre beş kat daha fazla, trilyon parametreli derin öğrenme modellerinin oluşturulmasına olanak tanıyan bir Python kitaplığıdır. DeepSpeed ​​olmadan, aynı görev, 4,000 gün boyunca çatırdayan V100'den 2.5 kata kadar daha hızlı olan 100 Nvidia A100'ü gerektirir.

Araç, GPT-3'ün, modellerin sinir ağı ve veri kümesi ne kadar büyük olursa olsun, geliştirmeye devam ettiğini göstermesinden sonra özellikle yararlıdır. Ancak bu, en son yenilikleri daha az kaynağa sahip daha küçük ekiplerin erişiminden uzaklaştırmakla tehdit etti, ancak DeepSpeed ​​bu ekiplerin minimum donanımla çok daha büyük hizmetlerle rekabet etmesine izin verdi. Bulut işlemeye geçiş, büyük model AI eğitimini daha da erişilebilir hale getirebilir.

Microsoft'ta DeepSpeed ​​hakkında daha fazla bilgi edinin okuyunve ticari markaya bakın okuyun.

üzerinden alumia