Introductie door Project Director Hildelies Balk #impactdemo

Impact CoCNews

Hildelies Balk introduces the project. The IMPACT consortium was formed 2007 in the EC Seventh Framework Programme for Research & Development and started on 1 January 2008.

What are the challenges for OCR?

  • Warping of text
  • Shine through / bleed through
  • Annotations
  • Old fonts: gothic, long S
  • Incomplete letters
  • Historical language

IMPACT will help solving these OCR problems and during this day each step in the digitisation process will be further explained.

———————————————————————————————————————-

[slideshare id=6958500&doc=impactdemodagintrohildeliesbalk-110217041851-phpapp02]

Hildelies Balk introduceert het project. IMPACT is ontstaan in 2007 binnen het Zevende Kaderprogramma voor Research & Development en gestart op 1 januari 2008.

Welke uitdagingen zijn er voor OCR?

  • Verbogen tekst door vocht
  • Doorschijnen van de andere pagina door dikke inkt of dun papier
  • Annotaties
  • Oude lettertypen; Gotisch, lange s
  • Incomplete letters, door versleten zetletters
  • Historische taalproblemen

IMPACT draagt bij aan het oplossing van deze problemen voor de OCR software en deze dag zal ingaan op elke stap in het digitaliseringsproces.

Lotte Wilms, Koninklijke Bibliotheek