Hildelies Balk – Pennington de Jongh from the Koninklijke Bibliotheek, the National Library of the Netherlands, and project leader of the IMPACT project, opened the day by introducing the project, its aims and goals, and giving an outlook on the Centre of Competence, which will sustain the project’s developments into the future.
http://vimeo.com/32259176
[slideshare id=9696747&doc=01balkprojektvorstellung-111014090133-phpapp01]
Hildelies Balk – Pennington de Jongh von der der Koninklijke Bibliotheek, der Nationalbibliothek der Niederlande, stellte das Projekt IMPACT vor, welches sie auch leitet.
Zunächst erläuterte Frau Balk – Pennington de Jongh spezifische Herausforderungen für die OCR-Anwendung an Digitalisaten alter Drucke, wie Verwerfungen im Papier, Durchscheinen, Fraktur-Schrift, handschriftliche Notizen, schwieriges Layout und sich im Laufe der Zeit ändernde Orthographie. Anschließend skizzierte sie das EU-geförderte Projekt IMPACT – IMProving ACcess to Text -, das 2008 unter der Federführung der Nationalbibliothek der Niederlande initiiert wurde und inzwischen 26 Institutionen umfasst.
Ziel des Projekts ist es, die Digitalisierung historischer Drucke durch optimierte OCR-Texterkennung und Sprachsoftware maßgeblich zu verbessern und Digitalisierungs- und Texterkennungs-Kompetenz über ganz Europa hinweg zu schaffen und zu verbreiten.
Unter anderem konnte im Projektrahmen Vorverarbeitung von Bildern, sowie die Erkennung von Seitenstrukturen, Frakturschriften und historischen Schreibvarianten verbessert werden, indem u.a. auf historische Texte zugeschnittene Wörterbücher entwickelt wurden. Dennoch besteht weiterhin Optimierungsbedarf.
Um die Ergebnisse von IMPACT auch über die Projektlaufzeit hinaus nutzen zu können, wird ein Kompetenzzentrum geschaffen, welches im Zuge der Abschlusskonferenz in London (24. und 25. Oktober 2011) eröffnet werden wird.
RM (BSB); Mark-Oliver Fischer (BSB)