Збагачення історичних записів: підхід на основі OCR та ШІ для інтеграції баз даних
Автори: Zahra Abedi, Richard M.K. van Dijk, Gijs Wijnholds, Tessa Verhoef
Опубліковано: 2026-01-01
Переглянути на arXiv →Анотація
Ця стаття представляє конвеєр, керований ШІ та оптичним розпізнаванням символів (OCR), для оцифрування та інтеграції історичних документів у бази даних. Він вирішує такі проблеми, як мінливість макета та відмінності в термінології, роблячи величезні обсяги історичних даних більш доступними та придатними для досліджень та цифрових гуманітарних наук.