Warum auf Gemini Ultra warten, wenn Sie GPT-4 Turbo mit Vision über den Azure OpenAI-Dienst nutzen können?

Symbol für die Lesezeit 2 Minute. lesen


Leser unterstützen MSpoweruser. Wir erhalten möglicherweise eine Provision, wenn Sie über unsere Links kaufen. Tooltip-Symbol

Lesen Sie unsere Offenlegungsseite, um herauszufinden, wie Sie MSPoweruser dabei helfen können, das Redaktionsteam zu unterstützen Lesen Sie weiter

OpenAI GPT-4 Turbo vs. Gemini Ultra

OpenAIs GPT-4 Turbo mit Vision ist ein großes multimodales Modell (LMM), das Bilder analysieren und Textantworten auf Fragen dazu liefern kann. Dieses fortschrittliche multimodale KI-Modell umfasst alle Funktionen von GPT-4 Turbo und bietet zusätzlich die Möglichkeit, Bildeingaben zu verarbeiten und zu analysieren. 

Heute Microsoft angekündigt dass GPT-4 Turbo mit Vision jetzt über Azure OpenAI Service verfügbar ist. Bestehende Azure OpenAI Service-Kunden in den Azure-Regionen Australien Ost, Schweden Mitte, Schweiz Nord und Westen der USA können jetzt auf den GPT-4 Turbo mit Vision-Dienst zugreifen.

Zusammen mit der Verfügbarkeit von GPT-4 Turbo mit Vision kündigt Microsoft folgende Verbesserungen an Azure AI-Diensten an, die erweiterte Funktionen ermöglichen.

  • Optische Zeichenerkennung (OCR): Extrahiert Text aus Bildern und integriert ihn mit der Eingabeaufforderung und dem Bild des Benutzers, um den Kontext zu bereichern. 
  • Objekterdung: Verbessert die Textantworten von GPT-4 Turbo mit Vision durch die Identifizierung und Umrisse wichtiger Objekte in Bildern. 
  • Videoansagen: Ermöglicht GPT-4 Turbo mit Vision, Fragen mithilfe der relevantesten Frames aus einem Video basierend auf der Eingabeaufforderung des Benutzers zu beantworten. 
  • Azure OpenAI Service für Ihre Daten mit Bildern: Durch die Kombination von GPT-4 Turbo mit Vision, Azure AI Search und Azure AI Vision können nun Bilder mit Textdaten hinzugefügt werden, wobei die Vektorsuche genutzt wird, um eine Lösung zu entwickeln, die eine Verbindung zu Benutzerdaten herstellt und so ein verbessertes Chat-Erlebnis ermöglicht.

Der GPT-4 Turbo mit Vision auf dem Azure OpenAI-Dienst wird basierend auf der Anzahl der Eingabe- und Ausgabetokens berechnet. Die Details finden Sie weiter unten.

Modellzufuhr Output 
GPT-4 Turbo mit Vision10.01 $ pro 1000 Token0.03 $ pro 1000 Token
+ Erweiterte Zusatzfunktionen für OCR1.50 $ pro 1000 Transaktionen
+ Erweiterte Zusatzfunktionen für Objekterdung1.50 $ pro 1000 Transaktionen
+ Verbesserte Add-on-Funktion für die Bildeinbettung „Fügen Sie Ihr Bild hinzu“.0.10 $ pro 1000 Transaktionen
+ Erweiterte Add-on-Funktion für Videoansagen mit integrierter Videoabfrage0.05 $ pro Minute für die Indizierung: 0.25 $ pro 1000 Transaktionen2

Anfang dieser Woche, Microsoft Research-Team enthüllt dass das GPT-4-Modell von OpenAI Google Gemini Ultra schlagen kann, wenn neue Eingabeaufforderungstechniken verwendet werden. Wenn Sie also auf Gemini Ultra warten, sollten Sie unbedingt GPT-4 Turbo mit Vision ausprobieren.

Mehr zu den Themen: GPT-4 Turbo mit Vision, Microsoft, openAI