OpenAI Whisper modeli artık Microsoft'un Azure OpenAI hizmetinde ve Azure AI Konuşma hizmetinde mevcut

Okuma zamanı simgesi 2 dk. okuman


Okuyucular MSpoweruser'ı desteklemeye yardımcı olur. Bağlantılarımız aracılığıyla satın alırsanız komisyon alabiliriz. Araç İpucu Simgesi

MSPoweruser'ın editör ekibini ayakta tutmasına nasıl yardımcı olabileceğinizi öğrenmek için açıklama sayfamızı okuyun. Daha fazla

Microsoft OpenAI Hizmeti OpenAI Fısıltı

Temmuz ayında Microsoft açıkladı OpenAI Whisper modelinin yakında Azure OpenAI Services'a geleceğini söyledi. Microsoft, geçtiğimiz Cuma günü, OpenAI Whisper modelinin artık Azure OpenAI hizmeti ve Azure AI Konuşma hizmetini kullanan müşterilerin kullanımına sunulduğunu duyurdu.

OpenAI fısıltı modeli, 57 dilde konuşma tanıma ve çeviri görevlerini gerçekleştirebilen bir sinir ağıdır. Web'den toplanan geniş ve çeşitli ses ve metin veri seti üzerinde eğitilmiştir. Transformer kodlayıcı-kod çözücü mimarisini temel alan basit bir uçtan uca yaklaşım kullanır ve gelişmiş okunabilirliğe ve ifade düzeyinde zaman damgalarına sahip transkriptler üretebilir.

Kuruluşlar artık aşağıdaki iki yolu kullanarak OpenAI Whisper modeline dayalı uygulamalar geliştirebilir:

Azure OpenAI hizmetindeki OpenAI Whisper modeli:

OpenAI zaten Whisper API'sini kendi başına sunuyor. Geliştiriciler, bu yeni Azure OpenAI Hizmetini kullanarak, transkripsiyon ve çeviri yetenekleri de dahil olmak üzere özellik ve işlevlerde aynı OpenAI Whisper API'sini kullanabilir. Whisper modelinin transkripsiyon ve çeviriye yönelik REST API'leri Azure OpenAI Hizmeti portalında bulunabilir.

Azure AI Konuşmasında OpenAI Whisper modeli:

Azure AI Speech kullanıcıları artık yeni OpenAI'nin Whisper modelini mevcut Azure AI Speech toplu transkripsiyon API'si ile birlikte kullanabilir. Azure AI Speech'teki Whisper kullanıcıları, eşzamansız işleme, konuşmacı günlüğü oluşturma, özelleştirme ve daha büyük dosya boyutları gibi mevcut özelliklerden yararlanır. Ayrıntıları aşağıda bulabilirsiniz.

  • Büyük dosya boyutları: Azure AI Speech, boyutu 1 GB'a kadar olan dosyaları etkinleştirerek Whisper transkripsiyonunu geliştirir ve tek bir istekte 1000'e kadar dosyayı toplu olarak işlemenize olanak tanıyarak büyük miktarlarda dosyaları işleme yeteneğini geliştirir.
  • Zaman damgaları: Azure AI Konuşma kullanılarak, tanıma sonucu, kelime düzeyinde zaman damgaları içerir ve her kelimenin sesin neresinde söylendiğini belirleme olanağı sağlar.
  • Konuşmacı günlüğü: Bu, bir ses dosyasındaki bireysel konuşmacıları tanımlayan ve konuşma bölümlerini etiketleyen Azure AI Konuşmasının başka bir yararlı özelliğidir. Bu özellik, müşterilerin konuşmacılar arasında ayrım yapmasına, sözlerini doğru bir şekilde yazıya dökmesine ve ses dosyalarının daha düzenli ve yapılandırılmış bir kopyasını oluşturmasına olanak tanır.
  • Özelleştirme/İnce Ayar (yakında kullanıma sunulacak): Azure Speech'teki Özel Konuşma özelliği, müşterilerin tanıma doğruluğunu ve tutarlılığını artırmak için Whisper'ı kendi verileri üzerinde ince ayar yapmasına olanak tanır.

Konular hakkında daha fazla bilgi: Azure OpenAI Hizmeti, microsoft, OpenAI Fısıltı