Merek dagang Microsoft DeepSpeed, perpustakaan AI 1 Triliun Parameter mereka

Ikon waktu membaca 2 menit Baca


Pembaca membantu dukungan MSpoweruser. Kami mungkin mendapat komisi jika Anda membeli melalui tautan kami. Ikon Keterangan Alat

Baca halaman pengungkapan kami untuk mengetahui bagaimana Anda dapat membantu MSPoweruser mempertahankan tim editorial Baca lebih lanjut

kecepatan tinggi

Microsoft telah mengajukan merek dagang untuk DeepSpeed, perpustakaan AI mereka yang dioptimalkan yang memungkinkan pelatihan model AI skala besar pada perangkat keras sederhana.

Merek dagang, yang diajukan pada 8 Desember 2020, mengacu pada “menyediakan penggunaan sementara perangkat lunak komputer online yang tidak dapat diunduh untuk pemrosesan kecerdasan buatan dan pembelajaran mendalam,” menyarankan Microsoft mungkin berpikir untuk membuat DeepSpeed ​​tersedia melalui layanan cloud online.

DeepSpeed, dirilis pada Februari tahun ini, adalah pustaka Python yang memungkinkan pembuatan model pembelajaran mendalam dengan satu triliun parameter, lebih dari lima kali lipat model terbesar di dunia saat ini, hanya menggunakan 800 kartu grafis Nvidia V100. Tanpa DeepSpeed, tugas yang sama akan membutuhkan 4,000 Nvidia A100, yang 2.5 kali lebih cepat dari V100, yang bekerja selama 100 hari.

Alat ini sangat berguna setelah GPT-3 menunjukkan bahwa model terus meningkatkan jaringan saraf dan set data yang lebih besar. Namun, ini mengancam untuk mendorong inovasi terbaru keluar dari jangkauan tim yang lebih kecil dengan sumber daya yang lebih sedikit, tetapi DeepSpeed ​​telah memungkinkan tim ini untuk bersaing dengan layanan yang jauh lebih besar dengan perangkat keras minimal. Perpindahan ke pemrosesan cloud dapat membuat pelatihan AI model besar menjadi lebih mudah diakses.

Baca lebih lanjut tentang DeepSpeed ​​di Microsoft di sini, dan lihat merek dagangnya di sini.

melalui alumni