IBM, Konuşma Tanıma doğruluğunda Microsoft'u geride bıraktı

Okuma zamanı simgesi 2 dk. okuman


Okuyucular MSpoweruser'ı desteklemeye yardımcı olur. Bağlantılarımız aracılığıyla satın alırsanız komisyon alabiliriz. Araç İpucu Simgesi

MSPoweruser'ın editör ekibini ayakta tutmasına nasıl yardımcı olabileceğinizi öğrenmek için açıklama sayfamızı okuyun. Daha fazla

Geçen yıl, Microsoft konuşma tanıma konusunda oldukça etkileyici bir atılım yaptı. Şirket, konuşma tanıma teknolojisinin ulaştığını iddia etti. sadece %5.9 ile “insan paritesi” WER (Kelime Hata Oranı). Ve şimdi IBM, konuşma tanıma teknolojisiyle daha da düşük bir WER elde etti. Şirket, Microsoft'un %5.5'luk rekorunu %5.9 ile geçerek %0.4'lik bir kelime hata oranına ulaştığını iddia ediyor.

Microsoft daha önce IBM'in %6.9 WER rekorunu kırdı Eylül 6.3'da %2016'lük bir hata oranı elde ederek. Dolayısıyla, Microsoft'un IBM'e geri dönmesi muhtemelen uzun sürmeyecektir.

İlginç olan, IBM'in şirketin henüz insan paritesine ulaşmadığını iddia etmesi. Microsoft'tan farklı olarak IBM, insan paritesinin %5.1'lik bir WER'de olduğunu iddia ediyor - ki bu henüz herhangi bir konuşma tanıma teknolojisi tarafından elde edilemedi. IBM'in önde gelen araştırma bilimcisi George Saon şunları söyledi:

“İnsan eşitliğine ulaşmak – yani iki insanın konuşmasıyla aynı oranda bir hata oranı anlamına gelir – uzun zamandır endüstrinin nihai hedefi olmuştur. Sektördeki diğerleri bizimle birlikte bu dönüm noktasının peşinden koşuyor ve bazıları son zamanlarda insan paritesine eşdeğer olarak yüzde 5.9'a ulaştığını iddia etti… ama henüz şampanyayı patlatmıyoruz. Bugünkü dönüm noktasına ulaşma sürecimizin bir parçası olarak, insan paritesinin aslında şimdiye kadar elde edilenden daha düşük olduğunu belirledik - yüzde 5.1 ile.”

IBM, bir blog yazısında, şirketin LSTM (Uzun Kısa Süreli Bellek) ve WaveNet dil modellerini birleştirerek Microsoft'tan daha düşük bir hata oranı elde edebildiğini söyledi.

Konular hakkında daha fazla bilgi: Cortana, ibm, IBM Laboratuvarları, IBM Konuşma Tanıma, microsoft, microsoft araştırması, MSR, Konuşma tanıma

Yorum bırak

E-posta hesabınız yayımlanmayacak. Gerekli alanlar işaretlenmişlerdir. *