Навіщо чекати Gemini Ultra, якщо ви можете використовувати GPT-4 Turbo з Vision через службу Azure OpenAI

Значок часу читання 2 хв. читати


Читачі допомагають підтримувати MSpoweruser. Ми можемо отримати комісію, якщо ви купуєте через наші посилання. Значок підказки

Прочитайте нашу сторінку розкриття інформації, щоб дізнатися, як ви можете допомогти MSPoweruser підтримувати редакційну команду Читати далі

OpenAI GPT-4 Turbo проти Gemini Ultra

OpenAI GPT-4 Turbo with Vision це велика мультимодальна модель (LMM), яка може аналізувати зображення та надавати текстові відповіді на запитання про них. Ця вдосконалена мультимодальна модель штучного інтелекту включає всі можливості GPT-4 Turbo, додаючи можливість обробляти та аналізувати вхідні зображення. 

Сьогодні Microsoft оголошений що GPT-4 Turbo з Vision тепер доступний через Azure OpenAI Service. Існуючі клієнти служби Azure OpenAI у східній Австралії, центральній Швеції, північній Швейцарії та західному регіоні США Azure тепер можуть отримати доступ до служби GPT-4 Turbo with Vision.

Разом із доступністю GPT-4 Turbo with Vision, Microsoft оголошує про наступні вдосконалення служб Azure AI, що забезпечують розширені функції.

  • Оптичне розпізнавання символів (OCR): Витягує текст із зображень, інтегруючи його з підказкою користувача та зображенням для збагачення контексту. 
  • Заземлення об'єкта: покращує текстові відповіді від GPT-4 Turbo with Vision шляхом ідентифікації та окреслення ключових об’єктів на зображеннях. 
  • Відео підказки: дозволяє GPT-4 Turbo with Vision відповідати на запитання, використовуючи найбільш релевантні кадри з відео на основі підказки користувача. 
  • Служба Azure OpenAI для ваших даних із зображеннями: Завдяки поєднанню GPT-4 Turbo з Vision, Azure AI Search і Azure AI Vision зображення тепер можна додавати з текстовими даними, використовуючи векторний пошук для розробки рішення, яке з’єднується з даними користувача, забезпечуючи покращений досвід чату.

Плата за GPT-4 Turbo з Vision на Azure OpenAI стягуватиметься на основі кількості вхідних і вихідних маркерів. Знайдіть деталі нижче.

Modelвхід Вихід 
GPT-4 Turbo with Vision10.01 долара за 1000 токенів0.03 долара за 1000 токенів
+ Розширені додаткові функції для OCR1.50 доларів США за 1000 транзакцій
+ Розширені додаткові функції для заземлення об’єктів1.50 доларів США за 1000 транзакцій
+ Розширена функція доповнення для вбудовування зображень «Додайте своє зображення».0.10 доларів США за 1000 транзакцій
+ Покращена додаткова функція для відеопідказок із інтеграцією відновлення відео0.05$ за хвилину для індексації 0.25$ за 1000 транзакцій2

На початку цього тижня дослідницька команда Microsoft виявлено що модель OpenAI GPT-4 може перемогти Google Gemini Ultra, якщо використовувати нові методи підказок. Отже, якщо ви чекаєте на Gemini Ultra, вам обов’язково варто спробувати GPT-4 Turbo with Vision.

Детальніше про теми: GPT-4 Turbo with Vision, Microsoft, openAI