Po co czekać na Gemini Ultra, skoro możesz używać GPT-4 Turbo z Vision za pośrednictwem usługi Azure OpenAI
2 minuta. czytać
Opublikowany
Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej
OpenAI's GPT-4 Turbo z wizją to duży model multimodalny (LMM), który może analizować obrazy i dostarczać tekstowych odpowiedzi na pytania na ich temat. Ten zaawansowany multimodalny model AI obejmuje wszystkie możliwości GPT-4 Turbo, a jednocześnie dodaje możliwość przetwarzania i analizowania danych wejściowych obrazu.
Dzisiaj Microsoft ogłosił że GPT-4 Turbo z Vision jest teraz dostępny za pośrednictwem usługi Azure OpenAI. Obecni klienci usługi Azure OpenAI Service we wschodniej Australii, Szwecji środkowej, północnej Szwajcarii i zachodnich stanach USA w regionach Azure mogą teraz uzyskać dostęp do usługi GPT-4 Turbo with Vision.
Wraz z udostępnieniem GPT-4 Turbo with Vision firma Microsoft ogłasza następujące ulepszenia usług Azure AI umożliwiające korzystanie z zaawansowanych funkcjonalności.
- Optyczne rozpoznawanie znaków (OCR): Wyodrębnia tekst z obrazów, integrując go z podpowiedzią i obrazem użytkownika, aby wzbogacić kontekst.
- Uziemienie obiektu: Poprawia odpowiedzi tekstowe z GPT-4 Turbo z funkcją Vision, identyfikując i zaznaczając kluczowe obiekty na obrazach.
- Podpowiedzi wideo: Umożliwia GPT-4 Turbo z Vision odpowiadanie na pytania przy użyciu najbardziej odpowiednich klatek z wideo na podstawie podpowiedzi użytkownika.
- Usługa Azure OpenAI na Twoich danych z obrazami: Łącząc GPT-4 Turbo z Vision, Azure AI Search i Azure AI Vision, można teraz dodawać obrazy z danymi tekstowymi, korzystając z wyszukiwania wektorowego w celu opracowania rozwiązania, które łączy się z danymi użytkownika, umożliwiając lepszą obsługę czatu.
Opłata za GPT-4 Turbo z Vision w usłudze Azure OpenAI zostanie naliczona na podstawie liczby tokenów wejściowych i wyjściowych. Znajdź szczegóły poniżej.
Model | Wkład | Wydajność |
GPT-4 Turbo z wizją1 | 0.01 USD za 1000 tokenów | 0.03 USD za 1000 tokenów |
+ Ulepszone funkcje dodatkowe dla OCR | 1.50 dolara za 1000 transakcji | |
+ Ulepszone funkcje dodatkowe dla uziemienia obiektu | 1.50 dolara za 1000 transakcji | |
+ Ulepszona funkcja dodatkowa do osadzania obrazu „Dodaj swój obraz”. | 0.10 dolara za 1000 transakcji | |
+ Ulepszona funkcja dodatkowa dla podpowiedzi wideo integrująca pobieranie wideo | 0.05 USD za minutę za indeksowanie 0.25 USD za 1000 transakcji2 |
Na początku tego tygodnia zespół badawczy Microsoft ujawnił że model GPT-4 OpenAI może pokonać Google Gemini Ultra, gdy zostaną użyte nowe techniki podpowiedzi. Jeśli więc czekasz na Gemini Ultra, zdecydowanie powinieneś wypróbować GPT-4 Turbo z Vision.