Наука |

Нейросеть аспиранта СВФУ научилась распознавать дифтонги

Нейросеть аспиранта СВФУ научилась распознавать дифтонги Фото: СВФУ

Нейросеть аспиранта института математики и информатики Северо-Восточного федерального университета Иннокентия Иванова, которая позволит создавать онлайн-переводчики с якутского языка, научилась распознавать дифтонги в 50% случаев, передает телеканал «Якутия 24».

В качестве предобученной модели выбрана ruGPT-3 от Сбера. Проект реализуется на средства гранта Российского фонда фундаментальных исследований.

«На сегодня нейросеть, обученная на видеоускорителе RTX 3070 Ti, еще не выдает полностью связный текст, но подходящие дифтонги в 50% случаев подставляет верные. Тем не менее, план работ перевыполнен, поскольку создание нейросети планировалось реализовать в середине 2022 года», – поделился ученый.

Для создания нейронной сети Иннокентий Иванов использовал материалы онлайн-СМИ: «Кыым», «Sakhaday», «Эдэр Саас», а также лингвистического корпуса якутского языка. Наполнение базы данных должно завершиться к марту-апрелю 2022 года.

В будущем аспирант планирует улучшить качество генерации текста и проработать его практическое применение.

«Следует внимательно отнестись к склонениям слов, дифтонгам. Смысл созданного нейронной сетью текста может исчезнуть после очередного неправильного склонения слов», – отметил он.

По итогам проекта Иннокентий Иванов опубликует модель нейронной сети в открытом доступе – она является многоцелевой и не заточена под конкретную задачу, ее применение возможно в широком спектре программ и приложений. Таким образом сервис можно будет добавить в свой продукт для мгновенного перевода текста с якутского языка, общения с техподдержкой.