Microsoft và NVIDIA công bố mô hình ngôn ngữ lớn nhất và mạnh mẽ nhất được đào tạo cho đến nay

Biểu tượng thời gian đọc 1 phút đọc

Biểu tượng lịch Được đăng trên 11 Tháng Mười

Được xuất bản trên 11 Tháng Mười

Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi.

Microsoft và NVIDIA hôm nay đã công bố mô hình Thế hệ ngôn ngữ tự nhiên Megatron-Turing hỗ trợ DeepSpeed và Megatron (MT-NLG), mô hình ngôn ngữ biến áp nguyên khối lớn nhất và mạnh mẽ nhất được đào tạo cho đến nay. Mô hình này bao gồm 530 tỷ thông số, gấp 3 lần số thông số so với mô hình lớn nhất hiện có, GPT-3. Việc đào tạo mô hình lớn như vậy bao gồm nhiều thách thức khác nhau. NVIDIA và Microsoft đã làm việc trên nhiều cải tiến và đột phá dọc theo tất cả các trục AI.

Ví dụ, khi hợp tác chặt chẽ với nhau, NVIDIA và Microsoft đã đạt được hiệu quả đào tạo chưa từng có bằng cách hội tụ cơ sở hạ tầng đào tạo tăng tốc GPU hiện đại với ngăn xếp phần mềm học tập phân tán tiên tiến. Chúng tôi đã xây dựng kho tài liệu đào tạo ngôn ngữ tự nhiên, chất lượng cao với hàng trăm tỷ mã thông báo và đồng phát triển các công thức đào tạo để cải thiện tính ổn định và hiệu quả tối ưu hóa.

Bạn có thể tìm hiểu thêm về dự án này từ các liên kết bên dưới.

nguồn: microsoft, Nvidia

Thông tin thêm về các chủ đề: microsoft, nvidia

Pradeep Viswav

Chuyên gia phần mềm và dịch vụ

Pradeep là sinh viên tốt nghiệp Khoa học và Kỹ thuật Máy tính. Anh ấy cũng là Đối tác sinh viên của Microsoft. Hiện anh đang làm việc tại một công ty CNTT hàng đầu.

Bình luận