Virtuelles DH-Kolloquium an der BBAW, 27.06.2022: „Transkribus – Erkennung handschriftlicher Dokumente mit Deep Learning“
Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 27. Juni 2022, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):
Günter Mühlberger (Universität Innsbruck, Forschungszentrum Digital Humanities)
Transkribus – Erkennung handschriftlicher Dokumente mit Deep Learning
Transkribus ist eine offene Plattform für die Erkennung von handschriftlichen historischen Dokumenten. Mehr als 85.000 Nutzer sind auf der Plattform registriert, mehrere hundert von ihnen arbeiten täglich mit der Software. Als einzige Plattform weltweit können die Nutzer neuronale Netze zur Texterkennung und Layoutanalyse in der Plattform trainieren und so die Erkennung handschriftlicher Dokumente für ihre spezifischen Dokumente optimieren.
Transkribus basiert auf Deep Learning und arbeitet unabhängig von Sprache und Alphabet. Mittelalterliche Dokumente in Latein können genauso verarbeitet werden wie Briefe aus dem Ersten Weltkrieg in Englisch und Deutsch oder Hebräisch und Arabisch. Mehr als 13.000 Modelle wurden bereits von den Nutzern trainiert. Insgesamt wurden über 30 Millionen Dokumente zur Verarbeitung in Transkribus hochgeladen.
Transkribus wurde im Rahmen eines EU-Forschungsprojekts unter der Leitung der Universität Innsbruck entwickelt. Im Anschluss an das Projekt wurde 2019 die europäische Genossenschaft READ-COOP SCE gegründet. READ-COOP hat mittlerweile fast 120 Mitglieder, darunter renommierte Archive, Bibliotheken und Universitäten aus der ganzen Welt.
In diesem Vortrag werden wir die Möglichkeiten diskutieren, die Transkribus allen bietet, die sich für die Erkennung historischer Dokumente interessieren. Dazu gehören nicht nur die Texterkennung und das Training von neuronalen Netzen, sondern auch die Suche in Sammlungen über die read&search-Anwendung und Crowd-Sourcing-Lösungen für Katasterdokumente. Schließlich berichten wir über neue Entwicklungen zur maschinellen Layoutanalyse auch für historische Zeitungen.
***
Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzrraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.
Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.
Kommentar schreiben