Google-kääntäjä saa 24 uutta kieltä uusimmassa päivityksessä

Lukuajan kuvake 3 min. lukea


Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta. Työkaluvihje-kuvake

Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää

Kääntäjä, Google tarjoaa 24 uutta kieltä ja murretta ilmoitti keskiviikkona. Monikieliseen hermosolujen konekäännöspalveluun lisätyt uudet kohteet sisältävät kieliä eri alueilta maailmanlaajuisesti, mukaan lukien ketšua, guarani ja aymara, joita pidetään Amerikan alkuperäiskielinä. Tämä tuo mukanaan kattamien kielten kokonaismäärän Google Translate on 133.

"Vuosia, Google Kääntäjä on auttanut murtamaan kielimuurit ja yhdistämään yhteisöjä kaikkialla maailmassa. Ja haluamme tehdä tämän mahdolliseksi entistä useammalle ihmiselle – erityisesti niille, joiden kieliä ei ole edustettuna useimmissa tekniikassa. Joten tänään olemme lisänneet Kääntäjään 24 kieltä, jotka tukevat nyt kaikkiaan 133:a eri puolilla maailmaa käytettyä kieltä”, sanoo Google-kääntäjän vanhempi ohjelmistosuunnittelija Isaac Caswell. "Yli 300 miljoonaa ihmistä puhuu näitä äskettäin lisättyjä kieliä - kuten mizoa, jota käyttää noin 800,000 45 ihmistä Koillis-Intiassa, ja lingalaa, jota käyttää yli XNUMX miljoonaa ihmistä Keski-Afrikassa."

Caswell huomauttaa, että tämä uusin Google-kääntäjän päivitys on melko erityinen, koska kielet ovat ensimmäisiä, jotka on lisätty "Zero-Shot Machine Translation" -sovelluksella. Hänen mukaansa näiden kielten koneoppimismalli "oppii kääntämään toiselle kielelle näkemättä koskaan esimerkkiä" ja "näkee vain yksikielisen tekstin". Tällä ohjelmistosuunnittelija myöntää, että se ei ole kaikin puolin täydellinen, vaikka hän pitääkin sitä vaikuttavana. "Ja jatkamme näiden mallien parantamista tarjotaksemme saman kokemuksen, johon olet tottunut esimerkiksi espanjan tai saksan käännöksissä", hän lisää. "Jos haluat perehtyä teknisiin yksityiskohtiin, tutustu Google AI -blogikirjoitukseen ja tutkimuspaperiin."

Tässä on täydellinen luettelo uusimmista Google-kääntäjään lisätyistä kielistä ja murteista sekä paikat, joissa niitä puhutaan ja niitä käyttävien puhujien määrä:

assami. Koillis-Intia (noin 25 miljoonaa puhujaa)

Aymara. Bolivia, Chile ja Peru (noin kaksi miljoonaa puhujaa)

Bambara. Mali (noin 14 miljoonaa puhujaa)

Bhojpuri. Pohjois-Intia, Nepal ja Fidži (noin 50 miljoonaa puhujaa)

Dhivehi. Malediivit (noin 300,000 XNUMX kaiutinta)

dogri. Pohjois-Intia (noin kolme miljoonaa puhujaa)

uuhi. Ghana ja Togo (noin seitsemän miljoonaa puhujaa)

Guarani. Paraguay ja Bolivia, Argentiina ja Brasilia (noin seitsemän miljoonaa puhujaa)

Ilocano. Pohjois-Filippiinit (noin 10 miljoonaa puhujaa)

Konkani. Keski-Intia (noin kaksi miljoonaa puhujaa)

Crio. Sierra Leone (noin neljä miljoonaa kaiutinta)

kurdi (sorani). Irak ja Iran (noin 15 miljoonaa puhujaa)

Lingala. Kongon demokraattinen tasavalta, Kongon tasavalta, Keski-Afrikan tasavalta, Angola ja Etelä-Sudanin tasavalta (noin 45 miljoonaa puhujaa)

Luganda. Uganda ja Ruanda (noin 20 miljoonaa puhujaa)

maithili. Pohjois-Intia (noin 34 miljoonaa puhujaa)

Meiteilon (manipuri). Koillis-Intia (noin kaksi miljoonaa puhujaa)

Mizo. Koillis-Intia (noin 830,000 XNUMX puhujaa)

oromo. Etiopia ja Kenia (noin 37 miljoonaa puhujaa)

quechua. Peru, Bolivia, Ecuador ja ympäröivät maat (noin 10 miljoonaa puhujaa)

Sanskrit. Intia (noin 20,000 XNUMX puhujaa)

sepedin. Etelä-Afrikka (noin 14 miljoonaa puhujaa)

Tigrinya. Eritrea ja Etiopia (noin kahdeksan miljoonaa puhujaa)

Tsonga. Eswatini, Mosambik, Etelä-Afrikka ja Zimbabwe (noin seitsemän miljoonaa puhujaa)

twi. Ghana (noin 11 miljoonaa puhujaa)