Hildelies Balk introduces the project. The IMPACT consortium was formed 2007 in the EC Seventh Framework Programme for Research & Development and started on 1 January 2008.
What are the challenges for OCR?
- Warping of text
- Shine through / bleed through
- Annotations
- Old fonts: gothic, long S
- Incomplete letters
- Historical language
IMPACT will help solving these OCR problems and during this day each step in the digitisation process will be further explained.
———————————————————————————————————————-
[slideshare id=6958500&doc=impactdemodagintrohildeliesbalk-110217041851-phpapp02]
Hildelies Balk introduceert het project. IMPACT is ontstaan in 2007 binnen het Zevende Kaderprogramma voor Research & Development en gestart op 1 januari 2008.
Welke uitdagingen zijn er voor OCR?
- Verbogen tekst door vocht
- Doorschijnen van de andere pagina door dikke inkt of dun papier
- Annotaties
- Oude lettertypen; Gotisch, lange s
- Incomplete letters, door versleten zetletters
- Historische taalproblemen
IMPACT draagt bij aan het oplossing van deze problemen voor de OCR software en deze dag zal ingaan op elke stap in het digitaliseringsproces.
Lotte Wilms, Koninklijke Bibliotheek