Пошук Azure AI тепер збільшує ємність пам’яті та розмір векторного індексу. Ось що змінилося

Це оновлення значно скорочує витрати.

Значок часу читання 2 хв. читати


Читачі допомагають підтримувати MSpoweruser. Ми можемо отримати комісію, якщо ви купуєте через наші посилання. Значок підказки

Прочитайте нашу сторінку розкриття інформації, щоб дізнатися, як ви можете допомогти MSPoweruser підтримувати редакційну команду Читати далі

Основні нотатки

  • Додатки RAG почнуть працювати у 2024 році, тому їм потрібне економічне отримання.
  • Azure AI Search покращує сховище та векторний пошук, залишаючись ефективним.
  • Оновлення забезпечують кращу продуктивність і масштабованість.

Microsoft має щойно недавно оголосила про що він розширює ємність пам’яті та розмір векторного індексу Azure AI Search, свого популярного інструменту для розробників на основі штучного інтелекту.

Оголошення надійшло якраз після запуску програм RAG у 2024 році, тому людям потрібне економічно ефективне отримання. Тепер у деяких регіонах нові базові та стандартні сервіси рівня пропонують більше місця для зберігання та потужності обробки, особливо для пошуку векторів, тексту та метаданих. Це оновлення значно скорочує витрати, оскільки ціна за один вектор зменшується приблизно на 85%, а загальні витрати на зберігання – до 75% або більше. 

Ці оновлення також означають, що ви можете зберігати більше даних на розділ, мати більші векторні індекси та насолоджуватися швидшою продуктивністю для таких завдань, як індексування та пошук.

Компанія також покращує роботу векторного пошуку та економить місце для зберігання. Тепер ви можете використовувати такі методи, як квантування та передискретизація, а також налаштувати параметри, щоб зменшити використання пам’яті до 75%. Крім того, встановлення властивості «Збережено» для векторних полів може додатково зменшити накладні витрати на зберігання

Azure AI Search — це інструмент, який спрощує створення розширених функцій пошуку та програм на основі штучного інтелекту шляхом поєднання мовних моделей із бізнес-даними. Це допомагає розробникам створювати функції пошуку для мобільних або веб-додатків, як для своєї компанії, так і для програмного забезпечення, яке вони пропонують як послугу.

Не так давно Microsoft також оголосила про нову модель Cohere Command R+ тепер доступний як одна із сотень мовних моделей у Azure AI. Модель, яка тільки що була представлена ​​сьогодні, має параметри 104B і, як стверджується, є кращою та дешевшою за GPT-4 Turbo.

Ви можете дізнатися більше про збільшену ємність тут.