Tại sao phải đợi Gemini Ultra khi bạn có thể sử dụng GPT-4 Turbo với Vision thông qua dịch vụ Azure OpenAI

Biểu tượng thời gian đọc 2 phút đọc

Biểu tượng lịch Được đăng trên 14 Tháng mười hai, 2023

Được xuất bản trên 14 Tháng mười hai, 2023

Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi.

OpenAI's GPT-4 Turbo với Tầm nhìn là một mô hình đa phương thức lớn (LMM) có thể phân tích hình ảnh và đưa ra câu trả lời bằng văn bản cho các câu hỏi về chúng. Mô hình AI đa phương thức tiên tiến này bao gồm tất cả các khả năng của GPT-4 Turbo đồng thời bổ sung khả năng xử lý và phân tích hình ảnh đầu vào.

Hôm nay, Microsoft công bố GPT-4 Turbo với Vision hiện có sẵn thông qua Dịch vụ Azure OpenAI. Các khách hàng hiện tại của Dịch vụ Azure OpenAI ở các khu vực Azure Đông Úc, Trung Thụy Điển, Bắc Thụy Sĩ và Tây Hoa Kỳ hiện có thể truy cập dịch vụ GPT-4 Turbo with Vision.

Cùng với sự sẵn có của GPT-4 Turbo với Vision, Microsoft sẽ công bố những cải tiến sau đây đối với các dịch vụ Azure AI hỗ trợ các chức năng nâng cao.

Nhận dạng ký tự quang học (OCR): Trích xuất văn bản từ hình ảnh, tích hợp nó với lời nhắc và hình ảnh của người dùng để làm phong phú thêm ngữ cảnh.
Nối đất đối tượng: Tăng cường phản hồi văn bản từ GPT-4 Turbo với Vision bằng cách xác định và phác thảo các đối tượng chính trong hình ảnh.
Lời nhắc video: Cho phép GPT-4 Turbo with Vision trả lời các câu hỏi bằng cách sử dụng các khung hình phù hợp nhất từ video dựa trên lời nhắc của người dùng.
Dịch vụ Azure OpenAI trên dữ liệu của bạn bằng hình ảnh: Bằng cách kết hợp GPT-4 Turbo với Vision, Azure AI Search và Azure AI Vision, giờ đây hình ảnh có thể được thêm vào dữ liệu văn bản, sử dụng tìm kiếm vectơ để phát triển giải pháp kết nối với dữ liệu của người dùng, giúp cải thiện trải nghiệm trò chuyện.

GPT-4 Turbo với Vision trên dịch vụ Azure OpenAI sẽ được tính phí dựa trên số lượng mã thông báo đầu vào và đầu ra. Tìm các chi tiết dưới đây.

Mô hình	Đầu vào	Đầu ra
GPT-4 Turbo với Tầm nhìn¹	0.01 đô la trên 1000 mã thông báo	0.03 đô la trên 1000 mã thông báo
+ Các tính năng bổ sung nâng cao cho OCR	1.50 USD trên 1000 giao dịch
+ Các tính năng bổ sung nâng cao cho Object Grounding	1.50 USD trên 1000 giao dịch
+ Tính năng bổ trợ nâng cao cho tính năng Nhúng hình ảnh “Thêm hình ảnh của bạn”	0.10 USD trên 1000 giao dịch
+ Tính năng bổ sung nâng cao cho Lời nhắc video tích hợp Truy xuất video	0.05 USD mỗi phút để lập chỉ mục 0.25 USD trên 1000 giao dịch²

Đầu tuần này, nhóm Nghiên cứu của Microsoft tiết lộ rằng mô hình GPT-4 của OpenAI có thể đánh bại Google Gemini Ultra khi sử dụng các kỹ thuật nhắc nhở mới. Vì vậy, nếu bạn đang chờ đợi Gemini Ultra, bạn chắc chắn nên dùng thử GPT-4 Turbo với Vision.

Thông tin thêm về các chủ đề: GPT-4 Turbo với Tầm nhìn, microsoft, mởAI

Pradeep Viswav

Chuyên gia phần mềm và dịch vụ

Pradeep là sinh viên tốt nghiệp Khoa học và Kỹ thuật Máy tính. Anh ấy cũng là Đối tác sinh viên của Microsoft. Hiện anh đang làm việc tại một công ty CNTT hàng đầu.