Azure AI Search kini meningkatkan kapasitas penyimpanannya, ukuran indeks vektor. Inilah yang berubah

Pembaruan ini sangat menghemat biaya.

Ikon waktu membaca 2 menit Baca


Pembaca membantu dukungan MSpoweruser. Kami mungkin mendapat komisi jika Anda membeli melalui tautan kami. Ikon Keterangan Alat

Baca halaman pengungkapan kami untuk mengetahui bagaimana Anda dapat membantu MSPoweruser mempertahankan tim editorial Baca lebih lanjut

Catatan kunci

  • Aplikasi RAG mulai beroperasi pada tahun 2024 dan memerlukan pengambilan yang hemat biaya.
  • Azure AI Search meningkatkan penyimpanan dan pencarian vektor, sehingga tetap efisien.
  • Peningkatan memberikan kinerja dan skalabilitas yang lebih baik.

Microsoft baru saja baru-baru ini mengumumkan bahwa mereka memperluas kapasitas penyimpanan dan ukuran indeks vektor Azure AI Search, alat populer yang didukung AI untuk pengembang.

Pengumuman ini tiba tepat ketika aplikasi RAG diluncurkan pada tahun 2024, sehingga orang-orang memerlukan pengambilan yang hemat biaya. Kini, di wilayah tertentu, layanan tingkat Dasar dan Standar baru menawarkan lebih banyak ruang penyimpanan dan kekuatan pemrosesan, terutama untuk menemukan vektor, teks, dan metadata. Pembaruan ini sangat menghemat biaya, dengan harga per vektor turun sekitar 85%, dan biaya penyimpanan keseluruhan berkurang hingga 75% atau lebih. 

Peningkatan ini juga berarti Anda dapat menyimpan lebih banyak data per partisi, memiliki indeks vektor lebih besar, dan menikmati kinerja lebih cepat untuk tugas-tugas seperti pengindeksan dan pencarian.

Perusahaan juga meningkatkan cara kerja pencarian vektor dan menghemat ruang penyimpanan. Sekarang, Anda dapat menggunakan teknik seperti kuantisasi dan oversampling, serta menyesuaikan pengaturan untuk mengurangi penggunaan penyimpanan hingga 75%. Selain itu, menyetel properti “Tersimpan” pada bidang vektor dapat mengurangi overhead penyimpanan lebih lanjut

Azure AI Search adalah alat yang memudahkan pembuatan fitur pencarian lanjutan dan aplikasi yang didukung AI dengan menggabungkan model bahasa dengan data bisnis. Ini membantu pengembang membangun fungsi pencarian untuk aplikasi seluler atau web, baik untuk perusahaan mereka atau untuk perangkat lunak yang mereka tawarkan sebagai layanan.

Belum lama ini, Microsoft juga mengumumkan model Command R+ baru dari Cohere sekarang tersedia sebagai salah satu dari ratusan model bahasa di Azure AI. Model yang baru diluncurkan hari ini memiliki parameter 104B dan diklaim lebih baik serta lebih murah dibandingkan GPT-4 Turbo.

Anda dapat menemukan detail lebih lanjut tentang peningkatan kapasitas di sini.