Microsoft mengumumkan beberapa fitur baru di Azure AI termasuk avatar text-to-speech

3 menit Baca

Ditampilkan di November 15, 2023

Diterbitkan di November 15, 2023

Pembaca membantu dukungan MSpoweruser. Kami mungkin mendapat komisi jika Anda membeli melalui tautan kami.

Layanan Azure AI memungkinkan pengembang membuat aplikasi AI dengan API dan model yang siap pakai dan siap pakai serta dapat disesuaikan. Layanan Azure AI mencakup layanan Vision, layanan Ucapan, layanan Penerjemah, dan banyak lagi. Di Ignite 2023, Microsoft hari ini mengumumkan beberapa fitur baru di Azure AI termasuk avatar text-to-speech, suara saraf pribadi, mode terjemahan mesin baru yang ditingkatkan, dan banyak lagi. Temukan detailnya di bawah ini.

Sebuah baru optimasi tugas kemampuan ringkasan dalam Bahasa Azure AI, didukung oleh model bahasa besar (GPT-3.5-Turbo, GPT-4, Z-Code++, dan lainnya).
Sebuah baru model terjemahan mesin mampu menerjemahkan dari satu bahasa ke bahasa lain tanpa menerjemahkan dalam bahasa Inggris sebagai perantara. Selain itu, terjemahan ini dapat disesuaikan menggunakan data pelanggan untuk menyelaraskan terjemahan dengan konteks industri.
Pengakuan entitas yang dinamai, penerjemahan dan peringkasan dokumen dalam wadah akan memungkinkan lembaga pemerintah dan industri, seperti layanan keuangan dan layanan kesehatan, dengan persyaratan residensi data yang ketat untuk menjalankan layanan AI pada infrastruktur mereka sendiri.
Suara pribadi, fitur suara saraf khusus baru yang memungkinkan bisnis membuat suara saraf khusus dengan sampel audio berdurasi 60 detik untuk penggunanya. Suara pribadi adalah fitur akses terbatas.
Avatar teks-ke-ucapan, kemampuan text-to-speech baru yang akan menghasilkan faksimili realistis dari seseorang yang berbicara berdasarkan masukan data teks dan video dari orang yang berbicara secara nyata. Baik avatar bawaan maupun khusus kini dalam pratinjau, namun avatar khusus adalah fitur akses terbatas.

Layanan Azure AI Vision mendapatkan pembaruan berikut:

Fungsionalitas keaktifan dan SDK Visi: Fungsi keaktifan akan membantu mencegah serangan spoofing pengenalan wajah dan mematuhi ISO 30107-3 PAD Level 2. Vision SDK untuk Wajah akan memungkinkan pengembang menambahkan pengenalan wajah dan keaktifan ke aplikasi seluler dengan mudah. Kedua fitur sedang dalam pratinjau.
Analisis Gambar 4.0: API ini memperkenalkan model Analisis Gambar mutakhir, yang mencakup pembuatan teks gambar, OCR, deteksi objek, dan banyak lagi, semuanya dapat diakses melalui satu titik akhir API yang sinkron. Khususnya, model OCR yang disempurnakan menawarkan peningkatan akurasi untuk teks yang diketik dan tulisan tangan dalam gambar. Analisis Gambar 4.0 umumnya tersedia.
Model yayasan Florence: Dilatih dengan miliaran pasangan teks-gambar dan terintegrasi sebagai layanan visi komputer siap produksi yang hemat biaya di Azure AI Vision, fitur yang ditingkatkan ini memungkinkan pengembang untuk membuat aplikasi visi komputer yang mutakhir, siap pasar, dan bertanggung jawab di berbagai industri. Model yayasan Florence umumnya tersedia.

Terakhir, pembaruan baru di Layanan AI Azure akan membuat proses mengekstraksi wawasan dari video menjadi lebih mudah dari sebelumnya. Anda sekarang dapat menggunakan Azure AI untuk mendapatkan ringkasan teks dari konten video. Juga, Anda dapat mencari sekarang mencari topik, momen, atau detail tertentu dalam video ekstensif menggunakan bahasa alami. Temukan detailnya di bawah ini.

Ringkasan video-ke-teks: Pengguna akan dapat mengekstrak esensi konten video dan menghasilkan ringkasan teks yang ringkas dan informatif. Algoritme tingkat lanjut mengelompokkan video menjadi beberapa bab yang koheren, memanfaatkan isyarat visual, audio, dan teks untuk membuat bagian yang mudah diakomodasi dalam jendela prompt model bahasa besar (LLM). Setiap bagian berisi konten penting, termasuk transkrip, acara audio, dan elemen visual. Ini ideal untuk membuat rekap video, materi pelatihan, atau berbagi pengetahuan.
Pencarian Konten Video yang Efisien: Pengguna akan dapat mengubah konten video ke dalam format yang dapat dicari menggunakan LLM dan wawasan Pengindeks Video. Dengan mengubah wawasan video menjadi petunjuk ramah LLM, sorotan utama dapat diakses untuk pencarian yang efektif. Segmentasi adegan, peristiwa audio, dan detail visual semakin menyempurnakan pembagian konten, memungkinkan pengguna dengan cepat menemukan topik, momen, atau detail tertentu dalam video ekstensif.

Lebih lanjut tentang topik: Azure AI, microsoft, avatar teks-ke-ucapan

Pradeep Viswav

Pakar Perangkat Lunak dan Layanan

Pradeep adalah Lulusan Ilmu Komputer dan Teknik. Dia juga merupakan Mitra Mahasiswa Microsoft. Saat ini dia bekerja di sebuah perusahaan IT terkemuka.