pte20210804017 Technologie/Digitalisierung, Forschung/Entwicklung

KI entschlüsselt Geheimnisse antiker Texte

Software der University of Notre Dame agiert ganz ähnlich wie ein forschender Schriftexperte


Raum mit historischen Manuskripten (Foto: stiftsbezirk.ch/de/stiftsbibliothek)
Raum mit historischen Manuskripten (Foto: stiftsbezirk.ch/de/stiftsbibliothek)

Notre Dame (pte017/04.08.2021/12:30)

Forscher der University of Notre Dame https://www.nd.edu/ im US-Bundesstaat Indiana entwickeln ein neuronales Netzwerk in Kombination mit maschinellem Lernen, um alte Handschriften zu entziffern. Allein in der Stiftsbibliothek St. Gallen https://www.stiftsbezirk.ch/de/ in der Schweiz werden 160.000 Dokumente aufbewahrt, von denen die meisten noch nicht entziffert sind, weil die Zahl der Experten, die alte Schriften entziffern und längst nicht mehr genutzte Sprachen verstehen, niedrig ist.

[b]Es begann mit alten lateinischen Texten[/b]

Die Maschine soll nachahmen, wie ein Schrift- und Sprachexperte alte Texte wahrnimmt und in eine moderne Sprache übersetzt. Ein Team um Walter Scheirer, Assistenzprofessor für Computerwissenschaften, untersuchte digitalisierte lateinische Handschriften, die im neunten Jahrhundert von Schriftgelehrten im Kloster St. Gallen geschrieben wurden, die bereits übersetzt waren. Die Forscher gaben beide Versionen in eine speziell entwickelte Softwareschnittstelle ein. Das Team maß dann die Zeiten, die für den Vergleich der einzelnen Teile der Texte nötig, um zu verstehen, welche Wörter, Zeichen und Passagen einfach oder schwierig waren. Scheirer sagt, so sei ein Netzwerk geschaffen worden, das Texte ähnlich wie menschliche Experten übersetzt.

[b]Psychophysische Messungen[/b]

„Es ist eine Strategie, die normalerweise nicht im maschinellen Lernen verwendet wird", sagt Scheirer. „Wir kennzeichnen die Daten durch psychophysische Messungen, das ist eine Methode zur Messung der Verbindungen zwischen physischen Reizen und mentalen Phänomenen, wie zum Beispiel die Zeit, die ein erfahrener Leser benötigt, um einen bestimmten Charakter zu erkennen, die Qualität einer Handschrift zu erfassen oder die Verwendung bestimmter Abkürzungen zu identifizieren.

[b]Bei äthiopischen Texten klappt es schon[/b]

„Wir informieren das Netzwerk dann über häufig auftretende Schwierigkeiten bei der Wahrnehmung dieser Zeichen und können basierend auf diesen Messungen Korrekturen vornehmen", so Scheirer. Basierend darauf gelang es bereits, das Programm so anzupassen, dass es äthiopische Texte in eine Sprache mit einem völlig anderen Zeichensatz transkribiert.

Das Transkribieren von alten Texten könne auch für Manuskripte wichtig sein, die außerhalb des westlichen Kulturkreises angefertigt worden sind, sagt Hildegund Müller, außerordentliche Professorin in der Abteilung für Klassische Philologie an Notre Dame. „Denken Sie nur an Sprachen, die in bedrohten Kulturen verschwinden. Wir müssen diese Texte bewahren, um sie irgendwann mal mit Hilfe von künstlicher Intelligenz übersetzen zu können."

(Ende)
Aussender: pressetext.redaktion
Ansprechpartner: Wolfgang Kempkens
Tel.: +43-1-81140-300
E-Mail: kempkens@pressetext.com
Website: www.pressetext.com
|