Azure AI Search øger nu sin lagerkapacitet, vektorindeksstørrelse. Her er, hvad der ændrede sig

Denne opdatering reducerer omkostningerne betydeligt.

Ikon for læsetid 2 min. Læs


Læsere hjælper med at understøtte MSpoweruser. Vi får muligvis en kommission, hvis du køber via vores links. Værktøjstip-ikon

Læs vores oplysningsside for at finde ud af, hvordan du kan hjælpe MSPoweruser med at opretholde redaktionen Læs mere

Nøgle noter

  • RAG-apps går live i 2024 og kræver en omkostningseffektiv hentning.
  • Azure AI Search booster lagring og vektorsøgning, forbliver effektiv.
  • Opgraderinger giver bedre ydeevne og skalerbarhed.

Microsoft har netop nyligt annoncerede at det udvider lagerkapaciteten og vektorindeksstørrelsen af ​​Azure AI Search, dets populære AI-drevne værktøj til udviklere.

Meddelelsen ankom netop som RAG-apps går live i 2024, så folk har brug for omkostningseffektiv hentning. Nu, i visse regioner, tilbyder nye Basic- og Standard-tiertjenester mere lagerplads og processorkraft, især til at finde vektorer, tekst og metadata. Denne opdatering reducerer omkostningerne betydeligt, idet prisen pr. vektor falder med omkring 85 %, og de samlede lageromkostninger reduceres med op til 75 % eller mere. 

Disse opgraderinger betyder også, at du kan gemme flere data pr. partition, have større vektorindekser og nyde hurtigere ydeevne til opgaver som indeksering og søgning.

Virksomheden forbedrer også, hvordan vektorsøgning fungerer og sparer lagerplads. Nu kan du bruge teknikker som kvantisering og oversampling og justere indstillinger for at reducere lagerforbruget med op til 75 %. Indstilling af egenskaben "Lagret" på vektorfelter kan desuden reducere lageroverhead yderligere

Azure AI Search er et værktøj, der gør det nemt at skabe avancerede søgefunktioner og AI-drevne applikationer ved at kombinere sprogmodeller med forretningsdata. Det hjælper udviklere med at opbygge søgefunktioner til mobil- eller webapps, uanset om det er til deres virksomhed eller til den software, de tilbyder som en tjeneste.

For ikke så længe siden sagde Microsoft også, at Coheres nye Command R+ model er nu tilgængelig som en af ​​de hundredvis af sprogmodeller i Azure AI. Modellen, som netop er blevet lanceret i dag, har 104B parametre og hævdes at være bedre og billigere end GPT-4 Turbo.

Du kan finde flere detaljer om den øgede kapacitet link..

Brugerforum

0 meddelelser