27 апреля в Якутии отмечают День Республики. К этому знаменательному дню в самом популярном в России сервисе перевода появился якутский язык.
Сохраняя культуру
Одним из инициаторов проекта популяризации якутского языка стал научный сотрудник Национальной библиотеки республики Алексей Иванов.
«Идея создать машинный перевод для слов и фраз на якутском языке возникла в 2017 году. Последние полтора года на общественных началах шел сбор двуязычных текстов и подготовка эталонных переводов с якутского на русский для оценки их качества. Могу сказать, что качество машинного перевода с якутского языка уже приближается к человеческому, но ещё требует совершенствования. Работа еще не окончена, данные будут собираться и дальше», - говорит Алексей Иванов.
Для включения языка в сервис перевода сотрудники Национальной библиотеки собрали около 50 тысяч фраз на якутском и их перевод на русский язык. Разработка шла в несколько этапов: сначала шло обучение нейросети на тех примерах, которые удалось собрать благодаря энтузиастам, затем обогащение полученной модели данными из родственных языков. Так как якутский относится к тюркской группе, была применена созданная ранее пантюркская модель, учитывающая морфологию, лексику и синтаксис сразу нескольких схожих языков. А чтобы нейросеть научилась составлять грамотные предложения на русском, использовали методику обратного перевода.
«Считаю, это очень важный момент в развитии и сохранении языка народа саха в киберпространстве. В первую очередь, это необходимо для наших будущих поколений», - сказал глава Якутии Айсен Николаев.
Что дальше?
Теперь якутские слова и фразы можно автоматически перевести на один из 98 языков мира, а также узнать, как выражение или слово будет звучать по-якутски.
Своим мнением с редакцией «АиФ на Севере» поделился житель Якутска Дмитрий Яковлев: «Я обрадовался, когда узнал, что появился такой переводчик. Родным языком владею, но иногда могу забыть то или иное слово, или нужно перевести печатный текст. Также думаю, что это важно для сохранения языка и культуры народа саха».
В дальнейших планах команды проекта – оцифровка культурного наследия коренных народов Арктики. Возможности Национальной библиотеки РС(Я) позволяют создать Центр цифровизации языкового и культурного наследия народов республики на основе текстовых, аудиовизуальных, архивных и музейных артефактов.
По данным переписи населения 2010 года, якутским языком владеют более 450 тысяч человек, большинство проживает на территории Якутии.
Правила комментирования
Эти несложные правила помогут Вам получать удовольствие от общения на нашем сайте!
Для того, чтобы посещение нашего сайта и впредь оставалось для Вас приятным, просим неукоснительно соблюдать правила для комментариев:
Сообщение не должно содержать более 2500 знаков (с пробелами)
Языком общения на сайте АиФ является русский язык. В обсуждении Вы можете использовать другие языки, только если уверены, что читатели смогут Вас правильно понять.
В комментариях запрещаются выражения, содержащие ненормативную лексику, унижающие человеческое достоинство, разжигающие межнациональную рознь.
Запрещаются спам, а также реклама любых товаров и услуг, иных ресурсов, СМИ или событий, не относящихся к контексту обсуждения статьи.
Не приветствуются сообщения, не относящиеся к содержанию статьи или к контексту обсуждения.
Давайте будем уважать друг друга и сайт, на который Вы и другие читатели приходят пообщаться и высказать свои мысли. Администрация сайта оставляет за собой право удалять комментарии или часть комментариев, если они не соответствуют данным требованиям.
Редакция оставляет за собой право публикации отдельных комментариев в бумажной версии издания или в виде отдельной статьи на сайте www.aif.ru.
Если у Вас есть вопрос или предложение, отправьте сообщение для администрации сайта.
Закрыть