В СВФУ разрабатывают нейросеть для обработки текста на якутском языке

В Северо-Восточном федеральном университете продолжают разработку нейросети, которая позволит обрабатывать тексты и создавать онлайн-переводчики с якутского на другие языки.

   
   

Для создания нейронной сети использованы текстовые версии веб-ресурсов СМИ: «Кыым», Sakhaday, «Эдэр Саас» и лингвистического корпуса якутского языка — к марту-апрелю завершится наполнение базы данных, добавил аспирант. В качестве предобученной модели выбрана RuGPT-3 от Сбера.

 «На сегодня нейросеть, обученная на видеоускорителе RTX 3070 Ti, еще не выдает полностью связный текст, но подходящие дифтонги в 50% случаев подставляет верные. Тем не менее план работ перевыполнен, поскольку создание нейросети планировалось реализовать в середине 2022 года», — рассказал автор исследования, аспирант Института математики и информатики СВФУ Иннокентий Иванов.

По итогам проекта Иннокентий Иванов опубликует модель нейронной сети в открытом доступе — она является многоцелевой и не заточена под конкретную задачу, ее применение возможно в широком спектре программ и приложений. По мнению аспиранта СВФУ, таким образом сервис на якутском языке можно оперативно добавить в свой продукт — в свою очередь, это откроет возможности для мгновенного перевода текста, общения с техподдержкой и многого другого.