Навіщо чекати Gemini Ultra, якщо ви можете використовувати GPT-4 Turbo з Vision через службу Azure OpenAI
2 хв. читати
Опубліковано
Прочитайте нашу сторінку розкриття інформації, щоб дізнатися, як ви можете допомогти MSPoweruser підтримувати редакційну команду Читати далі
OpenAI GPT-4 Turbo with Vision це велика мультимодальна модель (LMM), яка може аналізувати зображення та надавати текстові відповіді на запитання про них. Ця вдосконалена мультимодальна модель штучного інтелекту включає всі можливості GPT-4 Turbo, додаючи можливість обробляти та аналізувати вхідні зображення.
Сьогодні Microsoft оголошений що GPT-4 Turbo з Vision тепер доступний через Azure OpenAI Service. Існуючі клієнти служби Azure OpenAI у східній Австралії, центральній Швеції, північній Швейцарії та західному регіоні США Azure тепер можуть отримати доступ до служби GPT-4 Turbo with Vision.
Разом із доступністю GPT-4 Turbo with Vision, Microsoft оголошує про наступні вдосконалення служб Azure AI, що забезпечують розширені функції.
- Оптичне розпізнавання символів (OCR): Витягує текст із зображень, інтегруючи його з підказкою користувача та зображенням для збагачення контексту.
- Заземлення об'єкта: покращує текстові відповіді від GPT-4 Turbo with Vision шляхом ідентифікації та окреслення ключових об’єктів на зображеннях.
- Відео підказки: дозволяє GPT-4 Turbo with Vision відповідати на запитання, використовуючи найбільш релевантні кадри з відео на основі підказки користувача.
- Служба Azure OpenAI для ваших даних із зображеннями: Завдяки поєднанню GPT-4 Turbo з Vision, Azure AI Search і Azure AI Vision зображення тепер можна додавати з текстовими даними, використовуючи векторний пошук для розробки рішення, яке з’єднується з даними користувача, забезпечуючи покращений досвід чату.
Плата за GPT-4 Turbo з Vision на Azure OpenAI стягуватиметься на основі кількості вхідних і вихідних маркерів. Знайдіть деталі нижче.
Model | вхід | Вихід |
GPT-4 Turbo with Vision1 | 0.01 долара за 1000 токенів | 0.03 долара за 1000 токенів |
+ Розширені додаткові функції для OCR | 1.50 доларів США за 1000 транзакцій | |
+ Розширені додаткові функції для заземлення об’єктів | 1.50 доларів США за 1000 транзакцій | |
+ Розширена функція доповнення для вбудовування зображень «Додайте своє зображення». | 0.10 доларів США за 1000 транзакцій | |
+ Покращена додаткова функція для відеопідказок із інтеграцією відновлення відео | 0.05$ за хвилину для індексації 0.25$ за 1000 транзакцій2 |
На початку цього тижня дослідницька команда Microsoft виявлено що модель OpenAI GPT-4 може перемогти Google Gemini Ultra, якщо використовувати нові методи підказок. Отже, якщо ви чекаєте на Gemini Ultra, вам обов’язково варто спробувати GPT-4 Turbo with Vision.