Überspringen zu Hauptinhalt

Mainzer Buchwissenschaft Teil der dritten Phase von OCR-D

Die Mainzer Buchwissenschaft wird im Rahmen der dritten Phase von OCR-D gemeinsam mit Dr. Vincent Christlein vom Pattern Recognition Lab der FAU Erlangen-Nürnberg an der Verbesserung von OCR für alte Drucke arbeiten. Die DFG fördert das auf zwei Jahre angelegte Projekt mit 215.000€. Ansprechpartner in Mainz sind PD Dr. Christoph Reske und Dr. Nikolaus Weichselbaumer.

Aufbauend auf den Ergebnissen aus der zweiten Phase wird das Projekt Algorithmen entwickeln, die es erlauben, in Scans alter Drucke automatisch und kleinteilig die dort verwendeten Schriftarten zu erkennen. Zusätzlich werden schriftartspezifische Trainingsdaten transkribiert und damit OCR-Modelle trainiert. Im Zusammenspiel dieser drei Bausteine verspricht das Projekt einen Beitrag zur Verbesserung von OCR für alte Drucke zu leisten.

An den Anfang scrollen