Microsoft công bố Phi-3-vision, SLM đa phương thức mới dành cho các kịch bản AI trên thiết bị
1 phút đọc
Cập nhật vào
Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm
Ghi chú chính
- Phi-3-vision là mô hình tham số 4.2B hỗ trợ các tác vụ suy luận trực quan chung và lập luận biểu đồ/đồ thị/bảng
Tại Build 2024, Microsoft ngày nay mở rộng dòng Phi-3 gồm các mô hình ngôn ngữ nhỏ AI với Phi-3-vision mới. Phi-3-vision là mô hình tham số 4.2B hỗ trợ các tác vụ suy luận trực quan chung và lý luận biểu đồ/đồ thị/bảng. Mô hình có thể lấy cả hình ảnh và văn bản làm phản hồi văn bản đầu vào và đầu ra.
Microsoft hôm nay cũng đã công bố tính sẵn có rộng rãi của Phi-3-mini trong dịch vụ Mô hình dưới dạng dịch vụ (MaaS) của Azure AI. Mô hình Phi-3 đang có được động lực vì chúng tiết kiệm chi phí và được tối ưu hóa cho các kịch bản AI trên thiết bị, biên, suy luận ngoại tuyến và các tình huống AI bị ràng buộc về độ trễ.
Ngoài tin tức về các mẫu Phi-3, Microsoft còn công bố các tính năng mới trên các API để mang lại trải nghiệm đa phương thức. Azure AI Speech hiện có tính năng phân tích giọng nói và dịch thuật phổ quát. Azure AI Search hiện có dung lượng lưu trữ tăng đáng kể và kích thước chỉ mục vectơ tăng tới 12 lần mà không mất thêm chi phí để hỗ trợ khối lượng công việc RAG lớn trên quy mô lớn.
Diễn đàn người dùng
Tin nhắn 0