Vortrag: Wie funktioniert OCR? Grundlagen, Stand der Technik und aktuelle Herausforderungen. Clemens Neudecker (Staatsbibliothek zu Berlin)

0 Veröffentlicht von Sophie Eckenstaler am

Texterkennung (Optical Character Recognition, OCR) ist die Technologie um aus Scans (also Bildern) von Dokumenten digitale, editierbare und durchsuchbare Volltexte zu erzeugen. Sowohl durch Digital Humanities als auch Künstliche Intelligenz steigt der Bedarf von Wissenschaft und Forschung an digitalen Texten. Jedoch ist die Texterkennung, insbesondere für historische Dokumente, noch stets eine sowohl technisch als auch organisatorisch hoch komplexe Aufgabe. Der Vortrag hat daher zum Ziel die Grundlagen, technischen Verfahren und den aktuellen Stand der Entwicklungen im Bereich der OCR vorzustellen um so einen gründlichen Überblick über die Möglichkeiten und Herausforderungen zu geben. Dabei werden neben Ursprung und Geschichte der OCR insbesondere die vielfältigen Verarbeitungsschritte in einem typischen OCR-Workflow, die besonderen Anforderungen von historischem Material sowie aktuelle Forschungsprojekte und technologische Entwicklungen im Zentrum stehen.

Clemens Neudecker arbeitet als Forscher, Projektmanager und Library Hacker an der Staatsbibliothek zu Berlin. Er ist dort unter anderem eingebunden in das umfangreiche Verbundprojekt OCR-D. Seine Arbeitsschwerpunkte sind Computer Vision, Natural Language Processing, Machine Learning & Artificial Intelligence und ihr Einsatz in den Bereichen Digitale Bibliotheken und Digital Humanities.

Der Vortrag ist Teil der Reihe „Werkzeug. Zur Praxis computergestützter Forschung in den Geistes- und Kulturwissenschaften“ der Kompetenzwerkstatt Digital Humanities (KDH) an der Universitätsbibliothek der Humboldt-Universität zu Berlin.

Hinweis zur Veranstaltung

Vortrag und Gespräch auf deutsch.

Datum: 15.02.2024, 14-16 Uhr

Ort: Jacob-und-Wilhelm-Grimm-Zentrum, Auditorium (Universitätsbibliothek, Geschwister-Scholl-Straße 1/3, 10117 Berlin)

Die Veranstaltung findet hybrid statt. Zugangsdaten schicken wir nach Anmeldung per Mail an ub.makerspace@hu-berlin.de.

Weitere Informationen zur Vortragsreihe Werkzeug auf der Homepage der KDH

Allgemein   

Kommentar schreiben