Mit künstlicher Intelligenz historische Dokumente entziffern
Bibliotheken und Archive stellen in großem Umfang ihre Bestände als Digitalisate online zur Verfügung und erleichtern so den Zugang für Forschung und Lehre. Dabei kommt standardmäßig spezielle Software zum Einsatz, um aus den digitalen Abbildern der gescannten Bücher und Schriftstücke automatisiert maschinenlesbare Texte zu gewinnen. Diese automatische Volltexterkennung liefert aber bisher nur bei gedruckten Dokumenten verlässliche Ergebnisse. Da das Schriftbild handschriftlicher Dokumente zu individuell ist, stehen diese meist nicht als elektronische Volltexte zur Verfügung. Hierfür wäre eine ressourcenintensive, manuelle Übertragung nötig. Die Entzifferung kann je nach Umfang des Materials sowie Epoche und individueller Hand der Schreiberin oder des Schreibers zu einem langwierigen und schwierigen Unterfangen werden. Dies gilt gerade für jene Wissenschaftlerinnen und Wissenschaftler, die im Rahmen ihrer Forschung in großem Umfang historische und literarische Quellen auswerten.
Den Prozess der Transkription so weit wie möglich zu automatisieren, hatte sich das EU-geförderte READ Projekt zum Ziel gesetzt. Eine Forschungsgruppe an der Universität Innsbruck entwickelte mit einem europaweiten Team die cloudbasierte virtuelle Forschungsumgebung Transkribus zur computergestützten Transkription und (semi-)automatischen Texterkennung handschriftlicher Dokumente. Möglich wird diese durch den Einsatz künstlicher Intelligenz. Auf Grundlage manuell abgetippter Beispielseiten lernt das Programm, die Schriften zu lesen. Das Projekt war so erfolgreich, dass es 2019 in eine Europäische Genossenschaft (SCE) überführt wurde, um für eine nachhaltige und kooperative Weiterentwicklung der Software und Infrastruktur zu sorgen. Zu den Gründungsmitgliedern gehören neben der Universität Innsbruck und mehreren internationalen Universitäten auch Kulturinstitutionen wie das Finnische Nationalarchiv und die British Library.
Die CAU ist im August 2020 Mitglied der READ-Genossenschaft geworden, um an der weiteren Entwicklung von Transkribus zu partizipieren und für die Forschung und Lehre in Kiel einfacher nutzbar zu machen. »Mit dem Beitritt stärken wir die Digital Humanities an der CAU. Transkribus ist ein wichtiger Baustein beim Aufbau einer fortschrittlichen digitalen Infrastruktur für die Geisteswissenschaften«, freut sich Vizepräsidentin Professorin Anja Pistor-Hatam. Auch für die READ-COOP ist die Kieler Beteiligung ein Grund zur Freude: »Wir sind eine Einrichtung, die versucht, Forschende, Lehrende und Hüterinnen und Hüter von Kulturgut über alle Grenzen hinweg mit dem gemeinsamen Ziel der Handschriftenerkennung zu verbinden. Vor diesem Hintergrund freuen wir uns ganz besonders, die traditionsreiche Christian-Albrechts-Universität zu Kiel als Mitglied begrüßen zu dürfen«, erklärt Dr. Andy Stauder, geschäftsführender Direktor der READ-COOP.
Die Universitätsbibliothek Kiel betreut die Mitgliedschaft und vermittelt die Services im Rahmen ihrer Digital Humanities-Aktivitäten. »Wir haben mit Transkribus einiges vor. Unser Ziel ist es, die handschriftlichen Sammlungen der Universitätsbibliothek wie etwa Nachlässe oder mittelalterliche Manuskripte projektbezogen zu digitalisieren, erschließen und durchsuchbar zu machen«, sagt Andreas Christ, der an der Bibliothek den Stabsbereich Digital Humanities und Forschungsdatenmanagement leitet. Außerdem wird Transkribus in Kooperation mit den Forschenden in Projekten eingesetzt, bei denen historische Textmaterialien digitalisiert, volltexterschlossen und ediert werden. In der forschungsbasierten Lehre kann Transkribus verwendet werden, um den Studierenden das Arbeiten mit digitalisiertem Quellenmaterial und Methoden der Digital Humanities näherzubringen. Die Universitätsbibliothek unterstützt Forschende und Lehrende beim Einstieg in und Einsatz von Transkribus.
RSS-Feeds @ Archäologie Online
- Nachrichten
- Videos
- Podcasts