Сервис Яндекса «Поиск по архивам» теперь предлагает доступ к документам из фондов Национального архива Якутии. В основном это метрические записи, фиксирующие важные события в жизни людей, такие как крещение и заключение брака, передает информационный портал «Якутия 24».
Об этом сообщил глава республики Айсен Николаев в своем Телеграм-канале.
По словам Айсега Николаева, пользователям доступны сканы 550 тысяч рукописных листов, предоставленных якутским архивом. Это около 3 000 дел, каждое из которых содержит метрические книги одной или нескольких церквей за определенный период.
«Эта инициатива позволит пользователям находить информацию о своих предках из Якутии, а исследователям — глубже изучить истории людей, живших в нашей республике», — приводятся слова Айсена Николаева.
Для обработки метрических книг сервис применяет нейросети, которые считывают старые рукописи и преобразуют их в печатный текст.
Как сообщили в Яндексе, Якутия стала не первым регионом России, с которым работает «Поиск по архивам» — всего таких регионов уже 20, включая Москву, Московскую, Омскую и Оренбургскую области, а также Чувашию. Каждый месяц база сервиса пополняется новыми историческими документами из различных уголков страны.
«Поиск по архивам», запущенный в начале 2023 года, предназначен для быстрого нахождения упоминаний о людях, населённых пунктах и событиях в расшифрованных нейросетью рукописных документах XVIII–XX веков. В его базе уже представлено более 16 миллионов страниц исторических документов из архивов Москвы, Московской, Оренбургской, Вологодской, Астраханской областей и других регионов.
Кроме того, пользователи могут искать информацию в архивах епархиальных ведомостей, дореволюционных газет и справочников из фондов Национальной электронной библиотеки и Российской государственной библиотеки.
Для оцифровки исторических документов сервис использует технологию оптического распознавания символов. Нейросеть распознаёт устаревшие знаки и учитывает особенности почерка, преобразуя трудночитаемые записи в понятный текст всего за несколько секунд.