Google Translate получает 24 новых языка в последнем обновлении

Значок времени чтения 3 минута. читать


Читатели помогают поддержать MSpoweruser. Мы можем получить комиссию, если вы совершите покупку по нашим ссылкам. Значок подсказки

Прочтите нашу страницу раскрытия информации, чтобы узнать, как вы можете помочь MSPoweruser поддержать редакционную команду. Читать далее

Появилось 24 новых языка и диалекта для перевода, Google объявил в среду. Новые элементы, добавленные в службу многоязычного нейронного машинного перевода, включают языки из разных регионов мира, в том числе кечуа, гуарани и аймара, которые считаются коренными языками Америки. Таким образом, общее количество языков, охватываемых Google Translate, в 133.

"Годами, Google Translate помог преодолеть языковые барьеры и объединить сообщества по всему миру. И мы хотим сделать это возможным для еще большего числа людей, особенно для тех, чьи языки не представлены в большинстве технологий. Итак, сегодня мы добавили в Translate 24 языка, и теперь мы поддерживаем в общей сложности 133 языка, которые используются по всему миру», — говорит старший инженер-программист Google Translate Исаак Касвелл. «Более 300 миллионов человек говорят на этих недавно добавленных языках, таких как мизо, на котором говорят около 800,000 45 человек на крайнем северо-востоке Индии, и лингала, на котором говорят более XNUMX миллионов человек в Центральной Африке».

Касуэлл отмечает, что это последнее обновление для Google Translate довольно особенное, учитывая, что языки первыми добавляются с помощью «Zero-Shot Machine Translation». По его словам, модель машинного обучения для этих языков «научится переводить на другой язык, даже не видя примера» и «видит только одноязычный текст». При этом инженер-программист признает, что он не идеален во всех отношениях, хотя и воспринимает это как нечто впечатляющее. «И мы продолжим улучшать эти модели, чтобы обеспечить тот же опыт, к которому вы привыкли, например, с испанским или немецким переводом», — добавляет он. «Если вы хотите углубиться в технические детали, ознакомьтесь с нашим сообщением в блоге Google AI и исследовательской статьей».

Вот полный список последних языков и диалектов, добавленных в Google Translate, а также места, где на них говорят, и количество говорящих на них:

Ассамский. Северо-Восточная Индия (около 25 миллионов говорящих)

Аймара. Боливия, Чили и Перу (около двух миллионов говорящих)

Бамбара. Мали (около 14 миллионов говорящих)

Бходжпури. Северная Индия, Непал и Фиджи (около 50 миллионов говорящих)

Дивехи. Мальдивы (около 300,000 XNUMX говорящих)

догри. Северная Индия (около трех миллионов говорящих)

овца. Гана и Того (около семи миллионов говорящих)

Гуарани. Парагвай и Боливия, Аргентина и Бразилия (около семи миллионов говорящих)

Илокано. Северные Филиппины (около 10 миллионов говорящих)

конкани. Центральная Индия (около двух миллионов говорящих)

Крио. Сьерра-Леоне (около четырех миллионов говорящих)

Курдский (сорани). Ирак и Иран (около 15 миллионов говорящих)

Лингала. Демократическая Республика Конго, Республика Конго, Центральноафриканская Республика, Ангола и Республика Южный Судан (около 45 миллионов говорящих)

Luganda. Уганда и Руанда (около 20 миллионов говорящих)

майтхили. Северная Индия (около 34 миллионов говорящих)

Мейтейлон (Манипури). Северо-Восточная Индия (около двух миллионов говорящих)

Mizo. Северо-Восточная Индия (около 830,000 XNUMX говорящих)

ор. Эфиопия и Кения (около 37 миллионов говорящих)

Кечуа. Перу, Боливия, Эквадор и соседние страны (около 10 миллионов говорящих)

санскрит. Индия (около 20,000 XNUMX говорящих)

Северный сото. Южная Африка (около 14 миллионов говорящих)

тигринья. Эритрея и Эфиопия (около восьми миллионов говорящих)

Тсонга. Эсватини, Мозамбик, Южная Африка и Зимбабве (около семи миллионов говорящих)

Twi. Гана (около 11 миллионов говорящих)