Microsoft đào tạo Phi-3 Mini chỉ trong một tuần với GPU H100 thân thiện với AI của Nvidia

Phiên bản Mini của Phi-3 là mẫu duy nhất hiện có

Biểu tượng thời gian đọc 2 phút đọc


Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi. Biểu tượng chú giải công cụ

Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm

Ghi chú chính

  • Microsoft ra mắt mẫu Phi-3, dẫn đầu là Phi-3 Mini với thông số 3.8B,
  • Mô hình này đã được đào tạo trên 3.3 nghìn tỷ mã thông báo trong bảy ngày bằng cách sử dụng 512 GPU NVIDIA H100.
  • Họ Phi-3 còn bao gồm các biến thể Nhỏ và Trung bình, vượt trội so với các mẫu trước đó như Phi-2.

Microsoft ra mắt Gia đình Phi-3 của các mẫu mã, một trong những mẫu mã nhỏ tốt nhất trên thị trường ở thời điểm hiện tại. Và bây giờ, Nvidia nói và mô tả cách công ty Redmond sử dụng GPU H100 của mình để đào tạo những mẫu máy này, hay cụ thể hơn là phiên bản Mini, 3.8B.

“Mô hình này có 3.8 tỷ thông số và được đào tạo trên 3.3 nghìn tỷ mã thông báo chỉ trong bảy ngày trên 512 GPU NVIDIA H100 Tensor Core,” nhà sản xuất công nghệ cho biết hôm thứ Ba. 

Họ Phi-3 có ba biến thể: Phi-3 Mini (3.8B), Phi-3 Small (7B) và Phi-3 Medium (14B). Đó là một cải tiến lớn so với trước đó Phi-2 đã được ra mắt chỉ với 2.7B thông số vài tháng trước. 

Đặc biệt hơn, Phi-3 Mini còn đi kèm hai tùy chọn tùy theo token hỗ trợ: 4K và 128K. Bạn có thể thử dịch vụ thứ hai tại trung tâm AI của Nvidia dưới dạng dịch vụ Nvidia NIM dành cho nhà phát triển và chạy mô hình cục bộ bằng Windows DirectML hoặc TensorRT-LLM.

“Mô hình Phi-3 vượt trội đáng kể so với các mô hình ngôn ngữ có cùng kích thước và kích thước lớn hơn trên các điểm chuẩn chính (xem số điểm chuẩn bên dưới, càng cao càng tốt),” Microsoft nói khi tung ra các mẫu xe, khoe khoang rằng phiên bản Nhỏ và Vừa có thể vượt trội hơn các mẫu lớn hơn như GPT-3.5T. 

Phiên bản Mini hiện đang có sẵn trên thị trường, nhưng Microsoft hứa rằng tất cả hai mẫu còn lại sẽ sớm ra mắt. Bạn cũng có thể dùng thử Phi-3 Mini trên Azure AI và Hugging Face.