Azure AI Search ökar nu sin lagringskapacitet, vektorindexstorlek. Här är vad som förändrades

Denna uppdatering sänker kostnaderna avsevärt.

Lästid ikon 2 min. läsa


Läsare hjälper till att stödja MSpoweruser. Vi kan få en provision om du köper via våra länkar. Verktygstipsikon

Läs vår informationssida för att ta reda på hur du kan hjälpa MSPoweruser upprätthålla redaktionen Läs mer

Viktiga anteckningar

  • RAG-appar går live 2024 och behöver kostnadseffektivt hämtas.
  • Azure AI Search ökar lagring och vektorsökning och förblir effektiv.
  • Uppgraderingar ger bättre prestanda och skalbarhet.

Microsoft har precis nyligen meddelat att det utökar lagringskapaciteten och vektorindexstorleken för Azure AI Search, dess populära AI-drivna verktyg för utvecklare.

Tillkännagivandet kom precis när RAG-appar går live 2024, så folk behöver kostnadseffektiv hämtning. Nu, i vissa regioner, erbjuder nya bas- och standardtjänster mer lagringsutrymme och processorkraft, särskilt för att hitta vektorer, text och metadata. Den här uppdateringen sänker kostnaderna avsevärt, med priset per vektor som sjunker med cirka 85 % och de totala lagringskostnaderna minskade med upp till 75 % eller mer. 

Dessa uppgraderingar innebär också att du kan lagra mer data per partition, ha större vektorindex och få snabbare prestanda för uppgifter som indexering och sökning.

Företaget förbättrar också hur vektorsökning fungerar och sparar lagringsutrymme. Nu kan du använda tekniker som kvantisering och översampling och justera inställningarna för att minska lagringsanvändningen med upp till 75 %. Att ställa in egenskapen "Lagrad" på vektorfält kan också minska lagringskostnader ytterligare

Azure AI Search är ett verktyg som gör det enkelt att skapa avancerade sökfunktioner och AI-drivna applikationer genom att kombinera språkmodeller med affärsdata. Det hjälper utvecklare att bygga sökfunktioner för mobil- eller webbappar, oavsett om det är för deras företag eller för programvaran de erbjuder som en tjänst.

För inte så länge sedan sa Microsoft också att Coheres nya Command R+-modell är nu tillgänglig som en av de hundratals språkmodellerna i Azure AI. Modellen, som just lanserats idag, har 104B parametrar och påstås vara bättre och billigare än GPT-4 Turbo.

Du kan hitta mer information om den ökade kapaciteten här..