Google Translate получает 24 новых языка в последнем обновлении
3 минута. читать
Опубликовано
Прочтите нашу страницу раскрытия информации, чтобы узнать, как вы можете помочь MSPoweruser поддержать редакционную команду. Читать далее
Появилось 24 новых языка и диалекта для перевода, Google объявил в среду. Новые элементы, добавленные в службу многоязычного нейронного машинного перевода, включают языки из разных регионов мира, в том числе кечуа, гуарани и аймара, которые считаются коренными языками Америки. Таким образом, общее количество языков, охватываемых Google Translate, в 133.
"Годами, Google Translate помог преодолеть языковые барьеры и объединить сообщества по всему миру. И мы хотим сделать это возможным для еще большего числа людей, особенно для тех, чьи языки не представлены в большинстве технологий. Итак, сегодня мы добавили в Translate 24 языка, и теперь мы поддерживаем в общей сложности 133 языка, которые используются по всему миру», — говорит старший инженер-программист Google Translate Исаак Касвелл. «Более 300 миллионов человек говорят на этих недавно добавленных языках, таких как мизо, на котором говорят около 800,000 45 человек на крайнем северо-востоке Индии, и лингала, на котором говорят более XNUMX миллионов человек в Центральной Африке».
Касуэлл отмечает, что это последнее обновление для Google Translate довольно особенное, учитывая, что языки первыми добавляются с помощью «Zero-Shot Machine Translation». По его словам, модель машинного обучения для этих языков «научится переводить на другой язык, даже не видя примера» и «видит только одноязычный текст». При этом инженер-программист признает, что он не идеален во всех отношениях, хотя и воспринимает это как нечто впечатляющее. «И мы продолжим улучшать эти модели, чтобы обеспечить тот же опыт, к которому вы привыкли, например, с испанским или немецким переводом», — добавляет он. «Если вы хотите углубиться в технические детали, ознакомьтесь с нашим сообщением в блоге Google AI и исследовательской статьей».
Вот полный список последних языков и диалектов, добавленных в Google Translate, а также места, где на них говорят, и количество говорящих на них:
Ассамский. Северо-Восточная Индия (около 25 миллионов говорящих)
Аймара. Боливия, Чили и Перу (около двух миллионов говорящих)
Бамбара. Мали (около 14 миллионов говорящих)
Бходжпури. Северная Индия, Непал и Фиджи (около 50 миллионов говорящих)
Дивехи. Мальдивы (около 300,000 XNUMX говорящих)
догри. Северная Индия (около трех миллионов говорящих)
овца. Гана и Того (около семи миллионов говорящих)
Гуарани. Парагвай и Боливия, Аргентина и Бразилия (около семи миллионов говорящих)
Илокано. Северные Филиппины (около 10 миллионов говорящих)
конкани. Центральная Индия (около двух миллионов говорящих)
Крио. Сьерра-Леоне (около четырех миллионов говорящих)
Курдский (сорани). Ирак и Иран (около 15 миллионов говорящих)
Лингала. Демократическая Республика Конго, Республика Конго, Центральноафриканская Республика, Ангола и Республика Южный Судан (около 45 миллионов говорящих)
Luganda. Уганда и Руанда (около 20 миллионов говорящих)
майтхили. Северная Индия (около 34 миллионов говорящих)
Мейтейлон (Манипури). Северо-Восточная Индия (около двух миллионов говорящих)
Mizo. Северо-Восточная Индия (около 830,000 XNUMX говорящих)
ор. Эфиопия и Кения (около 37 миллионов говорящих)
Кечуа. Перу, Боливия, Эквадор и соседние страны (около 10 миллионов говорящих)
санскрит. Индия (около 20,000 XNUMX говорящих)
Северный сото. Южная Африка (около 14 миллионов говорящих)
тигринья. Эритрея и Эфиопия (около восьми миллионов говорящих)
Тсонга. Эсватини, Мозамбик, Южная Африка и Зимбабве (около семи миллионов говорящих)
Twi. Гана (около 11 миллионов говорящих)