ИИ, нейросети и умные колонки заговорят на осетинском языке
ИИ, нейросети и умные колонки заговорят на осетинском языке
В Северной Осетии стартовал масштабный инициативный проект по созданию первого полноценного цифрового корпуса осетинского языка Ossetic.ru. Его цель собрать и обработать 1 миллион параллельных предложений на осетинском и русском языках, чтобы обучить искусственный интеллект понимать, переводить и даже говорить по-осетински.
Проект реализуется через краудсорсинговую платформу, где каждый носитель языка может внести свой вклад: перевести несколько фраз, проверить чужой перевод или сделать пожертвование. Все материалы проходят тщательную модерацию профессиональными лингвистами и преподавателями осетинской филологии, в том числе из Северо-Осетинского государственного университета.
Представьте, что вы хотите воспользоваться голосовым помощником Алисы или Google Translate на осетинском но они не понимают наш язык. Почему? Потому что у компьютеров просто нет данных для обучения. Мы создаём эту базу знаний, чтобы осетинский язык не остался за бортом цифровой эпохи, поясняет Тимур Гудиев, руководитель Фонда цифрового развития осетинского языка.
По оценкам разработчиков, создание корпуса из миллиона переводов потребует около 30 миллионов рублей. На начальном этапе проект поддерживается меценатами, а вся финансовая отчётность публикуется в открытом доступе. В дальнейшем команда рассчитывает на гранты и государственные субсидии.
Осетинский язык почти отсутствует в цифровой среде соцсетях, мессенджерах, голосовых интерфейсах. Проект Ossetic.ru призван изменить ситуацию: уже к 20272028 годам на основе созданного корпуса должны появиться мобильные приложения для изучения осетинского языка, электронные словари с функцией озвучки, системы автоматического перевода текстов, голосовые помощники, распознающие осетинскую речь.
Корпус формируется из самых разных источников: классической литературы, учебников, новостей, официальных документов и даже постов из социальных сетей. Техническую разработку платформы осуществляет компания Цифровая Алания.
Особое внимание уделяется вовлечению школьников и педагогов: учащиеся могут участвовать как волонтёры, а учителя осетинского языка выступать модераторами. Таким образом, проект становится не только технологическим, но и образовательным и культурным движением.
Платформа Ossetic.ru уже доступна для пользователей и приглашает всех неравнодушных принять участие в создании будущего для осетинского языка.