Die Texterkennung als Herausforderung bei der Digitalisierung von Tabellen

Bereits seit mehr als 5000 Jahren finden Volkszählungen statt. Während sie ursprünglich nur zur Steuererhebung und zu militärischen Zwecken durchgeführt wurden, dienten sie später auch der wissenschaftlichen Forschung. Die ersten Zählungen, die von Anfang an auch der Forschung zur Verfügung standen,...

Full description

Bibliographic Details
Main Author: André Davids
Format: Article
Language:deu
Published: Verein Deutscher Bibliothekarinnen und Bibliothekare (VDB) 2020-05-01
Series:o-bib. Das offene Bibliotheksjournal
Subjects:
Online Access:https://www.o-bib.de/article/view/5584
Description
Summary:Bereits seit mehr als 5000 Jahren finden Volkszählungen statt. Während sie ursprünglich nur zur Steuererhebung und zu militärischen Zwecken durchgeführt wurden, dienten sie später auch der wissenschaftlichen Forschung. Die ersten Zählungen, die von Anfang an auch der Forschung zur Verfügung standen, wurden 1846 unter der Leitung von Adolphe Quetelet in Belgien durchgeführt. Diese Zählungen wurden in regelmäßigen Abständen wiederholt. Da die Analyse dieser Zählungen aufgrund ihres Umfanges und ihres Formats sehr aufwendig ist, ist es sinnvoll, die dort enthaltenen Informationen mit Hilfe von Retrodigitalisierung und elektronischer Texterkennung aufzubereiten. Die wirtschaftswissenschaftliche Bibliothek der KU Leuven (Belgien) arbeitet zur Zeit an einem Projekt, das sich zum Ziel gesetzt hat, die gedruckten Ausgaben der belgischen Industriezählungen von 1846 bis 1947 als Excel-Kalkulationstabellen anzubieten. In diesem Artikel wird sowohl auf die damit verbundenen Herausforderungen eingegangen als auch die Arbeitsweise beschrieben.
ISSN:2363-9814