«ЯНДЕКС» НАУЧИЛ НЕЙРОСЕТЬ ЧИТАТЬ АРХИВНЫЕ РУКОПИСИ

«Яндекс» научил нейросеть читать архивные рукописи
Дата публикации: 25.01.2023

«Яндекс» научил нейросети расшифровывать архивные записи со трудной дореволюционной орфографией. Об этом сообщила пресс-служба компании. 

Попробовать технологию в действии можно в сервисе «Поиск по архивам»: он отмыкает всем хотящим доступ к более чем 2,5 млн страниц исторических документов с текстовой расшифровкой. Новый алгоритм, построенный на основании системы оптического распознавания символов, учитывает особенности почерка, узнаёт утратившие актуальность буквы и разумеет особенную структуру архивных документов.

Профессионалы компании выучили нейросеть на массиве данных из сотен тысяч рукописных строк из реальных текстов XVIII–XIX веков и десятков миллионов сгенерированных образцов. Материалы для обучения размечали и расшифровывали эксперты, они же контролировали качество распознавания. 

Рукописи, которые неподготовленному человеку сложно разобрать, технология «Яндекса» почти моментально превращает в печатный текст. Благодаря этому в базе сервиса можно живо отыскать документы с упоминанием фамилии, населенного пункта или любых иных слов.

Нейросеть прочитает грязные номера

«Для расшифровки одной страницы архивного рукописного текста специалисту может потребоваться до получаса времени. Наш сервис справляется с этим за несколько секунд. В проекте технологию можно использовать и для решения иных задач в продуктах «Яндекса», - заявила Елена Бубнова, руководитель «Поиска Яндекса»

«Поиск по архивам» повысит эффективность работы историков, социологов, демографов, генеалогов и поможет тем, кто отыскивает сведения о своей семье. Первым представленным в сервисе фондом стал Главархив Москвы - именно на его материалах разработчики обучали нейросеть. Теперь база пополнилась документами из архивов Оренбургской и Новгородской областей. Со временем количество хранилищ и доступных отсканированных файлов будет увеличиваться.

Отыскивать можно по материалам XVIII - начала XX веков, которые больше всего пользуются популярностью у пользователей. Это метрические книжки, исповедные ведомости и ревизские басни с результатами переписи населения. Документы можно найти по каталогу или через строку поиска. Есть фильтры по годам, архивам, фондам и описям. Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями «Яндекса». Если навести курсор на нужный фрагмент, он сразу подсветится и на цифровой копии.

Фото: «Яндекс»

Рекомендуем:

Комментарии
Для того, чтобы добавить комментарий необходимо
войти на сайт
Пока материал никто не комментировал.
Новости
«Рейтинг Рунета»: 34 рейтинга digital-подрядчиков
Сервис аналитики и подбора поставщиков «Рейтинг Рунета» представил 34 рейтинга-2025, в том числе 11 новых и 9 не имеющих аналогов на рынке: разработка и интеграция ИИ-решений, мобильный маркетинг, видео, инфлюенс-маркетинг, управление репутацией, комплексные коммуникации и 3 отраслевых - еком, ИТ и промышленность.
Дата публикации: 06.06.2025
ICL Техно и «Алми Партнер» подписали договор о сотрудничестве
Производитель вычислительной техники ICL Техно и разработчик общесистемного и прикладного программного обеспечения «Алми Имеющий отношение» подписали на полях ЦИПР-2025 соглашение о сотрудничестве. Имеющий отношениество направлено на совместное продвижение российских ИТ-решений и развитие технологической независимости предприятий.
Дата публикации: 06.06.2025
1234...
Статьи
МегаФон стал партнёром финансовой платформы Банки.ру
1 июня 2023 МегаФон и финансовая платформа Банки.ру (АО «Цифровые технологии») запускают партнёрство. Первый совместный проект позволит предоставить клиентам доступ к финансовым предложениям любого российского банка?участника платформы, независимо от наличия его отделения поблизости.
Автор: prteammf
Дата публикации: 30.07.2023
«МегаФон Облако» поможет учебным заведениям совершенствовать образовательный процесс
14 июня 2023 МегаФон предоставил виртуальную инфраструктуру Институту развития образования Свердловской области. Преподаватели, сотрудники и слушатели образовательного учреждения получили дополнительные возможности для развития дистанционных программ в безопасной облачной среде.
Автор: prteammf
Дата публикации: 30.07.2023
МегаФон разработает систему экомониторинга морской акватории Камчатского края
23 июня 2023 МегаФон стал партнёром Правительства Камчатского края в области обеспечения экологической безопасности морской среды. Оператор поможет внедрить технологии мониторинга для сохранения и восстановления морской экосистемы, а также предотвращения возможных природных и техногенных катастроф.
Автор: prteammf
Дата публикации: 30.07.2023
1234...
Вопросы
Отзывы
Информация
Разработка программ и автоматизация вашего бизнеса это основные направления нашей компании. Наше основное отличие это доступность и качество автоматизации.

Copyright © 2025
www.softbusiness.net
Контакты
Написать в отдел технической поддержки пользователей
По всем вопросам
обращаться
по телефону:
+7(918)3883-585