KI Lecture: Rekonstruktion von Meisterwerken altorientalischer Literatur durch KI
22.11.2021
Am 30. November erklärt Enrique Jiménez bei den KI Lectures der LMU, wie alte Texte digital wiederhergestellt werden können.
22.11.2021
Am 30. November erklärt Enrique Jiménez bei den KI Lectures der LMU, wie alte Texte digital wiederhergestellt werden können.
Papier ist eine hilfreiche Erfindung – seit etwa 2.000 Jahren wird es zur Überlieferung von Geschriebenem genutzt. Doch wie liest man Texte aus dem antiken Babylonien, die in den drei Jahrtausenden vor Christus in sumerischer und akkadischer Keilschrift in Tontafeln geritzt wurden? Gerade längere Werke sind oft nur in Bruchstücken überliefert. An der Rekonstruktion solcher Texte mittels Künstlicher Intelligenz (KI) arbeitet Professor Enrique Jiménez von der Fakultät für Kulturwissenschaften.
KI-gestützte Ansätze haben sich als besonders nützlich erwiesen, um zum Beispiel Teile des Gilgameš-Epos zu finden, des größten literarischen Werks des antiken Mesopotamiens. Durch teilweise automatisches Sequenzalignment konnte das Team um Professor Jiménez diesem bedeutenden Text zehn neue und bisher unerkannte Stücke zuordnen. Darüber hinaus arbeitet der Altorientalist derzeit an einem noch kaum erschlossenen literarischen Text, einer Art Kompendium von Parodien. Dieser Text ist seit der Antike ungelesen und der Forschung völlig neu. „So entdecke ich jeden Tag, an dem ich an ihm arbeite, neue Stücke und Textpassagen“, sagt Jiménez.
Es ist faszinierend zu sehen, wie der Text sich vor meinen Augen aus unscheinbaren Tonscherben zusammenfügt und nach Jahrtausenden der Vergessenheit wieder lebendig wird.Enrique Jiménez
Prof. Dr. Enrique Jiménez: „Die Rekonstruktion von Meisterwerken altorientalischer Literatur durch den Einsatz von KI“
Dienstag, 30. November 2021, 18:15 – 19:45 Uhr
Weitere Informationen über die „KI Lectures“ finden Sie hier.
Kontakt: ringvorlesung-lmu@lmu.de
Ähnlich wie ein Archäologe graben Sie alte Schätze aus und fügen Fragmente von Tontafeln zu einem sinnhaften Ganzen zusammen. Welche Hilfe bieten Ihnen computergestützte Methoden?
Enrique Jiménez: Wir untersuchen Tontafel-Fragmente, die vor Jahrzehnten ausgegraben wurden, aber bis heute noch unidentifiziert in den Magazinen von Museen wie dem British Museum und dem Irakischen Nationalmuseum liegen. Unsere digitale Plattform erleichtert die Erschließung dieser wertvollen, aber weitestgehend unausgewerteten Archivbestände ungemein, denn sie erlaubt uns, mit Kolleginnen und Kollegen aus der ganzen Welt bei der Rekonstruktion der Texte zusammenzuarbeiten. Schon jetzt ist die Plattform für die Rekonstruktion der verschiedenen Gattungen des altmesopotamischen Schrifttums (zum Beispiel Poesie, Divination, Lexikographie und Medizin) zu einem unentbehrlichen Werkzeug geworden.
In der Vergangenheit waren Altorientalistinnen und Altorientalisten eher pessimistisch, was die Rekonstruktion der babylonischen Literatur anbelangt. Sie zweifelten daran, dass die antiken Texte von Anfang bis Ende wiedergewonnen und lesbar gemacht werden könnten: Einige sagten, dass es Jahrhunderte dauern würde, andere, dass es vielleicht nie möglich sein würde. Ich denke, wir haben jetzt Grund, optimistischer zu sein.
Wir müssen einen Algorithmus entwickeln, der im Chaos der Einzelteile Zusammenhänge erkennt.Enrique Jiménez
Sie setzen auch KI ein. Wie lernt ein Algorithmus, Texte zu lesen und zusammenzufügen – und wird er dabei immer besser?
Enrique Jiménez: Glücklicherweise haben uns die Mesopotamier viele verschiedene Exemplare ihrer Texte hinterlassen. Leider sind jedoch nahezu alle Tontafeln beschädigt und die Texte somit nur in Bruchstücken überliefert. Unter Berücksichtigung dieser beiden Faktoren — Mehrfachüberlieferung und fragmentarischer Charakter — müssen wir also einen Algorithmus entwickeln, der im Chaos der Einzelteile Zusammenhänge erkennt.
Als erschwerender Faktor kommt hinzu, dass die Keilschrift mehrdeutig ist: Es gibt bis zu 25 Möglichkeiten, ein und dieselbe Silbe darzustellen. Folglich konnte auch jedes Wort auf viele verschiedene Arten geschrieben werden. Die erste Herausforderung besteht also darin, dem Computer Fragmente und Texte vorzulegen, von denen wir bereits wissen, dass sie übereinstimmen, und den Algorithmus auf diese bekannten Übereinstimmungen einzustellen. Dann testen wir den Algorithmus an neuen Texten, um zu sehen, wie gut er funktioniert, und optimieren ihn gegebenenfalls. Je mehr Texte wir einspeisen, desto besser wird er.
In Ihrer Forschung konzentrieren Sie sich unter anderem auf Texte, die eine poetische Struktur haben. Kann KI Dichtung verstehen?
Enrique Jiménez: Die Frage ist, was „verstehen“ hier bedeutet — wenn damit gemeint ist, signifikante Muster, intertextuelle Bezüge oder Regelmäßigkeiten zu finden, kann der Computer das natürlich tun, unter bestimmten Umständen sogar schneller und leichter als der Mensch. Wir haben viele neue Stücke gefunden, indem wir die poetische Struktur berücksichtigt haben, da bestimmte Wörter nur in bestimmten metrischen Positionen vorkommen: So wissen wir, wonach wir den Computer fragen müssen. Meiner Meinung nach ist das „Verstehen“ von Texten jedoch eng mit dem „Genießen“ von Texten verbunden, und das bleibt dem Menschen vorbehalten.
Prof. Dr. Enrique Jiménez ist Professor für altorientalische Literaturen am Institut für Assyriologie und Hethitologie an der Fakultät für Kulturwissenschaften der LMU.