IBM batte Microsoft per la precisione del riconoscimento vocale

Icona del tempo di lettura 2 minuto. leggere


I lettori aiutano a supportare MSpoweruser. Potremmo ricevere una commissione se acquisti tramite i nostri link. Icona descrizione comando

Leggi la nostra pagina informativa per scoprire come puoi aiutare MSPoweruser a sostenere il team editoriale Per saperne di più

L'anno scorso, Microsoft ha fatto una svolta piuttosto impressionante nel riconoscimento vocale. La società ha affermato che la sua tecnologia di riconoscimento vocale ha raggiunto “parità umana” con solo un 5.9% di WER (Tasso di errore di parola). E ora, IBM ha ottenuto un WER ancora più basso con la sua tecnologia di riconoscimento vocale. La società afferma di aver raggiunto un tasso di errore delle parole del 5.5%, battendo dello 5.9% il record di Microsoft del 0.4%.

Microsoft in precedenza battere il record WER del 6.9% di IBM raggiungendo un tasso di errore del 6.3% nel settembre del 2016. Quindi probabilmente non passerà molto tempo prima che Microsoft ritorni a IBM.

La cosa interessante è che IBM afferma che l'azienda deve ancora raggiungere la parità umana. A differenza di Microsoft, IBM afferma che la parità umana è a un WER del 5.1%, che deve ancora essere raggiunto da qualsiasi tecnologia di riconoscimento vocale. George Saon, uno dei principali ricercatori IBM, ha dichiarato:

“Raggiungere la parità umana, ovvero un tasso di errore pari a quello di due umani che parlano, è stato a lungo l'obiettivo finale del settore. Altri nel settore stanno inseguendo questo traguardo insieme a noi e alcuni hanno recentemente affermato di raggiungere il 5.9 percento come equivalente alla parità umana... ma non stiamo ancora bevendo lo champagne. Come parte del nostro processo per raggiungere il traguardo di oggi, abbiamo stabilito che la parità umana è in realtà inferiore a quella che chiunque ha ancora raggiunto, al 5.1 percento".

IBM ha affermato in un post sul blog che la società è stata in grado di ottenere un tasso di errore inferiore rispetto a Microsoft combinando i modelli linguistici LSTM (Long Short Term Memory) e WaveNet.

Maggiori informazioni sugli argomenti: Cortana, ibm, Laboratori IBM, Riconoscimento vocale IBM, microsoft, ricerca Microsoft, MSR, riconoscimento vocale

Lascia un Commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati con *