НЕЙРОСЕТЬ «ЯНДЕКСА» АКТИВНО ЗАНЯЛАСЬ «ПОИСКОМ ПО АРХИВАМ»

Нейросеть «Яндекса» активно занялась «Поиском по архивам»
Дата публикации: 25.01.2024

Нейросеть «Яндекса» в течение года расшифровала более 10 миллионов страниц исторических документов в «Поиске по архивам». Об этом говорится в известьи компании. 

Сервис «Яндекса» «Поиск по архивам» помогает историкам, социологам, демографам и журналистам выискать информацию об исторических событиях и личностях, а обычным людям - больше справиться о своих предках. Работать с архивными документами так же ещё бы, как с привычным «Поиском»: необходимо ввести слово, упоминание которого нужно найти, в поисковую строку. За год с момента запуска сервиса пользователи просмотрели расшифрованные нейросетью документы более 20 миллионов раз.

Первым партнёром «Поиска по архивам» стал Главархив Москвы. Именно на предоставленных им текстах нейросеть обучалась расшифровывать устаревшие символы и рукописи. На настоящее время в базу «Поиска по архивам» загружено более 5,4 миллиона страниц исторических материалов из Главархива Москвы - это больше половины всех документов сервиса.

Сейчас в «Поиске по архивам» есть документы из архивов 11 регионов, в том числе Москвы, Московской, Оренбургской, Новгородской, Иркутской, Астраханской и прочих областей. Всего в течение года работы сервиса нейросеть Яндекса распознала более 60 тысяч рукописных и печатных текстов середины XVIII - начала XX веков: это более 10 миллионов страниц или 492 миллиона строк. В «Поиске по архивам» хранятся расшифрованные архивные дела (например, метрические книжки и ревизские сказки) с информацией о людях, родившихся в России до революции.

Кроме того, в сервисе собраны 3,6 миллиона оцифрованных страниц периодических изданий, такая как «Советский спорт», «Вечерняя Москва» и епархиальные ведомости.

Технология расшифровки в «Поиске по архивам» основана на оптическом распознавании символов. Нейросеть узнаёт утратившие актуальность знаки (например, исчезнувшие из алфавита буквы), учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в печатный текст. Для работы с вёрсткой газетных страниц нейросеть умышленно адаптировали: она выучилась опознавать текст на непомерных полосах, набранный мелочным шрифтом на бумаге невысокой плотности.

Фото: «Яндекс»

Рекомендуем:

Комментарии
Для того, чтобы добавить комментарий необходимо
войти на сайт
Пока материал никто не комментировал.
Новости
НТВ запустил собственный ЦОД DCN1
Телеканал НТВ запустил собственный центр обработки данных (ЦОД) DCN1. Это первый ЦОД, расположенный в бизнес-центре класса А в 5-ти минутах от ТТК – рядом с Останкинской башней в новом Телекомплексе НТВ.Инфраструктура DCN1 полностью автономна от остального здания Технопарка. В ЦОД размещены 1020 IT-стоек.
Дата публикации: 05.06.2025
«Иртея» идет в Белоруссию
Российский производитель базовых станций связи «Иртея» выходит за кордон. Об этом пишут «Ведомости». Летом 2025 года «Иртея» планирует запустить тестирование своего оборудования стандарта 5G в Белоруссии. Об этом «Ведомостям» в кулуарах конференции «Цифровая индустрия промышленной России» (ЦИПР-2025) рассказал генеральный директор «Иртеи» Дмитрий Лаконцев.
Дата публикации: 05.06.2025
1234...
Статьи
МегаФон стал партнёром финансовой платформы Банки.ру
1 июня 2023 МегаФон и финансовая платформа Банки.ру (АО «Цифровые технологии») запускают партнёрство. Первый совместный проект позволит предоставить клиентам доступ к финансовым предложениям любого российского банка?участника платформы, независимо от наличия его отделения поблизости.
Автор: prteammf
Дата публикации: 30.07.2023
«МегаФон Облако» поможет учебным заведениям совершенствовать образовательный процесс
14 июня 2023 МегаФон предоставил виртуальную инфраструктуру Институту развития образования Свердловской области. Преподаватели, сотрудники и слушатели образовательного учреждения получили дополнительные возможности для развития дистанционных программ в безопасной облачной среде.
Автор: prteammf
Дата публикации: 30.07.2023
МегаФон разработает систему экомониторинга морской акватории Камчатского края
23 июня 2023 МегаФон стал партнёром Правительства Камчатского края в области обеспечения экологической безопасности морской среды. Оператор поможет внедрить технологии мониторинга для сохранения и восстановления морской экосистемы, а также предотвращения возможных природных и техногенных катастроф.
Автор: prteammf
Дата публикации: 30.07.2023
1234...
Вопросы
Отзывы
Информация
Разработка программ и автоматизация вашего бизнеса это основные направления нашей компании. Наше основное отличие это доступность и качество автоматизации.

Copyright © 2025
www.softbusiness.net
Контакты
Написать в отдел технической поддержки пользователей
По всем вопросам
обращаться
по телефону:
+7(918)3883-585