Azure AI Search теперь увеличивает емкость хранилища и размер векторного индекса. Вот что изменилось
Это обновление значительно сокращает расходы.
2 минута. читать
Опубликовано
Прочтите нашу страницу раскрытия информации, чтобы узнать, как вы можете помочь MSPoweruser поддержать редакционную команду. Читать далее
Ключевые заметки
- Приложения RAG выйдут в свет в 2024 году и нуждаются в экономичном извлечении.
- Azure AI Search повышает эффективность хранения и векторного поиска, сохраняя при этом эффективность.
- Обновления обеспечивают лучшую производительность и масштабируемость.
Microsoft только что недавно объявила о что он расширяет емкость хранилища и размер векторного индекса Azure AI Search, своего популярного инструмента на базе искусственного интеллекта для разработчиков.
Это объявление появилось как раз в тот момент, когда приложения RAG будут запущены в эксплуатацию в 2024 году, поэтому людям нужен экономически эффективный поиск. Теперь в некоторых регионах новые службы уровня «Базовый» и «Стандартный» предлагают больше места для хранения и вычислительной мощности, особенно для поиска векторов, текста и метаданных. Это обновление значительно снижает затраты: цена за вектор снижается примерно на 85 %, а общие затраты на хранение снижаются на 75 % и более.
Эти обновления также означают, что вы можете хранить больше данных в каждом разделе, иметь более крупные векторные индексы и получать более высокую производительность при выполнении таких задач, как индексирование и поиск.
Компания также улучшает работу векторного поиска и экономит место для хранения данных. Теперь вы можете использовать такие методы, как квантование и передискретизация, а также настраивать параметры, чтобы сократить использование памяти до 75%. Кроме того, установка свойства «Сохранено» для векторных полей может еще больше снизить накладные расходы на хранение.
Azure AI Search — это инструмент, который упрощает создание расширенных функций поиска и приложений на базе искусственного интеллекта путем объединения языковых моделей с бизнес-данными. Он помогает разработчикам создавать функции поиска для мобильных или веб-приложений как для своей компании, так и для программного обеспечения, которое они предлагают в качестве услуги.
Не так давно Microsoft также заявила, что новая модель Command R+ от Cohere теперь доступен как одна из сотен языковых моделей в Azure AI. Модель, представленная только сегодня, имеет параметры 104B и считается лучше и дешевле GPT-4 Turbo.
Более подробную информацию об увеличенной емкости можно найти здесь.