Новости Нейросети «Яндекса» помогут найти сведения о предках и исторических событиях в справочниках XIX‑Экс экс веков

vaspvort

Ночной дозор
Команда форума
Модератор
ПРОВЕРЕННЫЙ ПРОДАВЕЦ
Private Club
Старожил
Migalki Club
Меценат💰️
Регистрация
10/4/18
Сообщения
5.056
Репутация
9.908
Реакции
15.251
RUB
1.045
Сделок через гаранта
18
f0abc993d4ccc7a8e73c489642412dd1.jpg

В добавили новый тип документов — справочники из фондов Национальной электронной библиотеки и Российской государственной библиотеки. Нейросеть «Яндекса» расшифровала почти 600 книг или 275 тыс. страниц с адресами, списками государственных служащих и информацией о недвижимости, рассказали Хабру в компании. Историки, социологи, демографы и журналисты смогут получить доступ к новым сведениям об исторических событиях и личностях, а обычные люди — ещё больше узнать о своих предках.

В новых источниках по архивам можно найти биографические факты, которые раньше были доступны только в бумажном виде. Например, памятные книжки содержат списки ключевых персон губерний с их должностями. Из адресных книг можно узнать, где они жили, а из торгово‑промышленных справочников — каким делом занимались.

Историков, искусствоведов и других специалистов может также заинтересовать реклама прошлых веков, размещённая в таких документах. Кроме того, в справочниках содержится информация о регионах, ранее не представленных в Поиске по архивам, например: о Санкт‑Петербурге, Орловской, Воронежской и Калужской губерниях.

Благодаря сотрудничеству с Национальной электронной библиотекой и Российской государственной библиотекой ранее в «Поиске по архивам» впервые появились периодические издания: полные архивы «Советского спорта» и «Вечерней Москвы». В дальнейшем оцифрованных справочников станет ещё больше: нейросети «Яндекса» продолжат распознавать подобные документы и другие книги.

Технология расшифровки в «Поиске по архивам» основана на оптическом распознавании символов. Нейросеть узнаёт утратившие актуальность знаки (например, исчезнувшие из алфавита буквы), учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в печатный текст. Для работы с вёрсткой газетных страниц нейросеть специально адаптировали: она научилась распознавать текст на огромных полосах, набранный мелким шрифтом на бумаге низкой плотности.

 
  • Теги
    нейросети яндекс
  • Сверху Снизу