Microsoft dan NVIDIA mengumumkan model bahasa terbesar dan paling kuat yang dilatih hingga saat ini

Ikon waktu membaca 1 menit Baca

Ikon kalender Ditampilkan di Oktober 11, 2021

Diterbitkan di Oktober 11, 2021

Pembaca membantu dukungan MSpoweruser. Kami mungkin mendapat komisi jika Anda membeli melalui tautan kami.

Microsoft dan NVIDIA hari ini mengumumkan model Megatron-Turing Natural Language Generation (MT-NLG) yang didukung oleh DeepSpeed dan Megatron, model bahasa transformator monolitik terbesar dan paling kuat yang dilatih hingga saat ini. Model ini mencakup 530 miliar parameter, 3x jumlah parameter dibandingkan model terbesar yang ada, GPT-3. Pelatihan model sebesar itu melibatkan berbagai tantangan. NVIDIA dan Microsoft mengerjakan banyak inovasi dan terobosan di semua sumbu AI.

Misalnya, bekerja sama secara erat, NVIDIA dan Microsoft mencapai efisiensi pelatihan yang belum pernah terjadi sebelumnya dengan menggabungkan infrastruktur pelatihan akselerasi GPU yang canggih dengan tumpukan perangkat lunak pembelajaran terdistribusi yang mutakhir. Kami membangun korpora pelatihan bahasa alami berkualitas tinggi dengan ratusan miliar token, dan resep pelatihan yang dikembangkan bersama untuk meningkatkan efisiensi dan stabilitas pengoptimalan.

Anda dapat mempelajari lebih lanjut tentang proyek ini dari tautan di bawah ini.

Sumber: Microsoft, Nvidia

Lebih lanjut tentang topik: microsoft, nvidia

Pradeep Viswav

Pakar Perangkat Lunak dan Layanan

Pradeep adalah Lulusan Ilmu Komputer dan Teknik. Dia juga merupakan Mitra Mahasiswa Microsoft. Saat ini dia bekerja di sebuah perusahaan IT terkemuka.

Tinggalkan Balasan