Microsoft công bố Phi-3-vision, SLM đa phương thức mới dành cho các kịch bản AI trên thiết bị

Trang chủ » TIN TỨC

1 phút đọc

Cập nhật vào 23 Tháng Năm, 2024

by Pradeep Viswav

cập nhật trên 23 Tháng Năm, 2024

Chia sẻ bài báo này

Cải thiện hướng dẫn này

Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi.

Ghi chú chính

Phi-3-vision là mô hình tham số 4.2B hỗ trợ các tác vụ suy luận trực quan chung và lập luận biểu đồ/đồ thị/bảng

Tại Build 2024, Microsoft ngày nay mở rộng dòng Phi-3 gồm các mô hình ngôn ngữ nhỏ AI với Phi-3-vision mới. Phi-3-vision là mô hình tham số 4.2B hỗ trợ các tác vụ suy luận trực quan chung và lý luận biểu đồ/đồ thị/bảng. Mô hình có thể lấy cả hình ảnh và văn bản làm phản hồi văn bản đầu vào và đầu ra.

Microsoft hôm nay cũng đã công bố tính sẵn có rộng rãi của Phi-3-mini trong dịch vụ Mô hình dưới dạng dịch vụ (MaaS) của Azure AI. Mô hình Phi-3 đang có được động lực vì chúng tiết kiệm chi phí và được tối ưu hóa cho các kịch bản AI trên thiết bị, biên, suy luận ngoại tuyến và các tình huống AI bị ràng buộc về độ trễ.

Ngoài tin tức về các mẫu Phi-3, Microsoft còn công bố các tính năng mới trên các API để mang lại trải nghiệm đa phương thức. Azure AI Speech hiện có tính năng phân tích giọng nói và dịch thuật phổ quát. Azure AI Search hiện có dung lượng lưu trữ tăng đáng kể và kích thước chỉ mục vectơ tăng tới 12 lần mà không mất thêm chi phí để hỗ trợ khối lượng công việc RAG lớn trên quy mô lớn.

Pradeep Viswav

Chuyên gia phần mềm và dịch vụ

Pradeep là sinh viên tốt nghiệp Khoa học và Kỹ thuật Máy tính. Anh ấy cũng là Đối tác sinh viên của Microsoft. Hiện anh đang làm việc tại một công ty CNTT hàng đầu.

Diễn đàn người dùng

Tin nhắn 0

Sắp xếp theo:

Bình luận Hủy bỏ trả lời