O Azure AI Search agora aumenta sua capacidade de armazenamento e tamanho do índice vetorial. Aqui está o que mudou

Esta atualização reduz bastante os custos.

Ícone de tempo de leitura 2 minutos. ler


Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links. Ícone de dica de ferramenta

Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais

Notas chave

  • Os aplicativos RAG serão lançados em 2024 e precisarão de recuperação econômica.
  • O Azure AI Search aumenta o armazenamento e a pesquisa de vetores, mantendo-se eficiente.
  • As atualizações oferecem melhor desempenho e escalabilidade.

A Microsoft acabou de anunciou recentemente que está expandindo a capacidade de armazenamento e o tamanho do índice vetorial do Azure AI Search, sua popular ferramenta alimentada por IA para desenvolvedores.

O anúncio chegou no momento em que os aplicativos RAG foram lançados em 2024, então as pessoas precisam de uma recuperação econômica. Agora, em certas regiões, os novos serviços de nível Básico e Padrão oferecem mais espaço de armazenamento e poder de processamento, especialmente para localizar vetores, texto e metadados. Esta atualização reduz significativamente os custos, com o preço por vetor caindo cerca de 85% e os custos gerais de armazenamento reduzidos em até 75% ou mais. 

Essas atualizações também significam que você pode armazenar mais dados por partição, ter índices vetoriais maiores e aproveitar um desempenho mais rápido para tarefas como indexação e pesquisa.

A empresa também melhora o funcionamento da pesquisa vetorial e economiza espaço de armazenamento. Agora você pode usar técnicas como quantização e sobreamostragem e ajustar as configurações para reduzir o uso de armazenamento em até 75%. Além disso, definir a propriedade “Armazenado” em campos vetoriais pode reduzir ainda mais a sobrecarga de armazenamento

O Azure AI Search é uma ferramenta que facilita a criação de funcionalidades de pesquisa avançadas e aplicações baseadas em IA, combinando modelos de linguagem com dados empresariais. Ele ajuda os desenvolvedores a criar funções de pesquisa para aplicativos móveis ou da web, seja para sua empresa ou para o software que oferecem como serviço.

Não muito tempo atrás, a Microsoft também disse que o novo modelo Command R+ da Cohere já está disponível como um das centenas de modelos de linguagem no Azure AI. O modelo, que acaba de ser lançado hoje, possui parâmetros 104B e é considerado melhor e mais barato que o GPT-4 Turbo.

Você pode encontrar mais detalhes sobre o aumento da capacidade SUA PARTICIPAÇÃO FAZ A DIFERENÇA.