Власти Москвы совместно с "Яндексом" разрабатывают совместную платформу по распознаванию рукописных текстов архивных документов. Сервис облегчит поиск информации о жителях Москвы и Московской губернии до 1917 года, написал в личном блоге мэр столицы Сергей Собянин.
По словам главы города, Главархив Москвы продолжает работать над оцифровкой метрических книг, в дореволюционные времена заменявших акты гражданского состояния (рождение, брак, смерть и пр.). В профильном сервисе "Моя семья" доступно уже свыше шести миллионов страниц документов, подчеркнул Собянин.
"В дореволюционные времена функции современных загсов выполняли религиозные организации. В последние годы Главархив Москвы ведет систематическую работу по оцифровке метрических книг — сведений о рождении, браке и смерти москвичей и жителей Московской губернии православного, католического, лютеранского, мусульманского и иудейского вероисповедания. Более шести миллионов страниц уже выложено в открытом доступе в профильном сервисе "Моя семья". Почти все метрические книги доступны на русском языке", — отметил мэр Москвы.
В цифровом формате москвичам доступно свыше 420 тыс. страниц ревизских сказок и около 700 тысяч страниц исповедных ведомостей. Что касается общего банка информации сервиса, "Моя семья" содержит уже более 7,1 млн страниц архивных документов, и каждый месяц он увеличивается на 50–70 тысяч страниц. Благодаря переводу данных в электронный формат власти Москвы свели к нулю вероятность порчи бумаг или их случайной потери.
"Чтобы получить необходимую информацию, больше не требуется делать запросы и ездить, как на работу, в читальный зал Главархива Москвы. Достаточно воспользоваться ноутбуком или даже телефоном. К тому же исчез риск случайной порчи бумажных архивных документов в процессе работы с ними. И потому неслучайно, что число пользователей сервиса "Моя семья" уже составило более 10 миллионов человек", — рассказал мэр.
Ранее информацию в отсканированных рукописях приходилось искать вручную, для чего были нужны определенные архивоведческие данные: каждая неточность могла направить исследователя по ложному пути. В данный момент власти Москвы работают над машинным распознаванием написанных от руки документов – ими займутся нейросети.
"Нейросеть, действующая на основе технологий искусственного интеллекта, переведет архивные документы в машиночитаемый формат. Достаточно будет вбить в поисковую строку имя предка, и система выдаст все упоминания о нем. Вместо десятков часов сбор сведений займет считанные минуты. А вероятность ошибок и неточностей будет сведена к минимуму", — подытожил градоначальник.
Ранее Сергей Собянин постановил оказать системную поддержку сообществу потомков московских ополченцев. Организации предоставили грант из столичного бюджета в размере 50 млн руб.