В Сибири создали алгоритм для перевода дореволюционных изданий

1 0 В Сибири создали алгоритм для перевода дореволюционных изданий

Новосибирские ученые создали систему, позволяющую переводить дореволюционные тексты в современную русскую орфографию

Старые книги сегодня непонятны для многих россиян. После реформы орфографии русского языка изменились многие правила. Разработанная учеными система автоматически приведет текст в привычный для читателя вид практически без участия человека.

— В старом правописании морфем можно выделить несколько групп слов, — сообщает официальное издание СО РАН "Наука в Сибири". — Исследователи сопоставили устаревшее и современное написание для каждой из групп и, выявив закономерности между ними, описали правила перевода, лежащие в основе программы.

После завершения первого этапа перевода программа переходит к этапу замены устаревших букв.

Алгоритм создан для работы с большими объемами текстов. Он может выполнять рутинную работу редакторов и дает ученым дополнительные инструменты для анализа текстов.

Исследователи рассчитывают, что проект будет востребован массовыми пользователями, например, библиотеками с большим объемом дореволюционных фондов.

Источник: news.rambler.ru

Самое интересное в рубрике