Warum auf Gemini Ultra warten, wenn Sie GPT-4 Turbo mit Vision über den Azure OpenAI-Dienst nutzen können?

Symbol für die Lesezeit 2 Minute. lesen

Kalendersymbol Veröffentlicht am 14. Dezember 2023

Veröffentlicht am 14. Dezember 2023

Leser unterstützen MSpoweruser. Wir erhalten möglicherweise eine Provision, wenn Sie über unsere Links kaufen.

OpenAIs GPT-4 Turbo mit Vision ist ein großes multimodales Modell (LMM), das Bilder analysieren und Textantworten auf Fragen dazu liefern kann. Dieses fortschrittliche multimodale KI-Modell umfasst alle Funktionen von GPT-4 Turbo und bietet zusätzlich die Möglichkeit, Bildeingaben zu verarbeiten und zu analysieren.

Heute Microsoft angekündigt dass GPT-4 Turbo mit Vision jetzt über Azure OpenAI Service verfügbar ist. Bestehende Azure OpenAI Service-Kunden in den Azure-Regionen Australien Ost, Schweden Mitte, Schweiz Nord und Westen der USA können jetzt auf den GPT-4 Turbo mit Vision-Dienst zugreifen.

Zusammen mit der Verfügbarkeit von GPT-4 Turbo mit Vision kündigt Microsoft folgende Verbesserungen an Azure AI-Diensten an, die erweiterte Funktionen ermöglichen.

Optische Zeichenerkennung (OCR): Extrahiert Text aus Bildern und integriert ihn mit der Eingabeaufforderung und dem Bild des Benutzers, um den Kontext zu bereichern.
Objekterdung: Verbessert die Textantworten von GPT-4 Turbo mit Vision durch die Identifizierung und Umrisse wichtiger Objekte in Bildern.
Videoansagen: Ermöglicht GPT-4 Turbo mit Vision, Fragen mithilfe der relevantesten Frames aus einem Video basierend auf der Eingabeaufforderung des Benutzers zu beantworten.
Azure OpenAI Service für Ihre Daten mit Bildern: Durch die Kombination von GPT-4 Turbo mit Vision, Azure AI Search und Azure AI Vision können nun Bilder mit Textdaten hinzugefügt werden, wobei die Vektorsuche genutzt wird, um eine Lösung zu entwickeln, die eine Verbindung zu Benutzerdaten herstellt und so ein verbessertes Chat-Erlebnis ermöglicht.

Der GPT-4 Turbo mit Vision auf dem Azure OpenAI-Dienst wird basierend auf der Anzahl der Eingabe- und Ausgabetokens berechnet. Die Details finden Sie weiter unten.

Modell	zufuhr	Output
GPT-4 Turbo mit Vision¹	0.01 $ pro 1000 Token	0.03 $ pro 1000 Token
+ Erweiterte Zusatzfunktionen für OCR	1.50 $ pro 1000 Transaktionen
+ Erweiterte Zusatzfunktionen für Objekterdung	1.50 $ pro 1000 Transaktionen
+ Verbesserte Add-on-Funktion für die Bildeinbettung „Fügen Sie Ihr Bild hinzu“.	0.10 $ pro 1000 Transaktionen
+ Erweiterte Add-on-Funktion für Videoansagen mit integrierter Videoabfrage	0.05 $ pro Minute für die Indizierung: 0.25 $ pro 1000 Transaktionen²

Anfang dieser Woche, Microsoft Research-Team enthüllt dass das GPT-4-Modell von OpenAI Google Gemini Ultra schlagen kann, wenn neue Eingabeaufforderungstechniken verwendet werden. Wenn Sie also auf Gemini Ultra warten, sollten Sie unbedingt GPT-4 Turbo mit Vision ausprobieren.

Mehr zu den Themen: GPT-4 Turbo mit Vision, Microsoft, openAI

Pradeep Viswav

Experte für Software und Services

Pradeep ist Absolvent der Informatik und Ingenieurwissenschaften. Er war außerdem Microsoft Student Partner. Derzeit arbeitet er in einem führenden IT-Unternehmen.