
Johannes Bernhard rekonstruiert zerbrochene Tontafeln mit Keilschrift.
Computerlinguist setzt antike Tontafeln wieder zusammen
Das Problem, mit dem sich der 25-Jährige Computerlinguist in seiner Masterarbeit auseinandersetzt, würden viele eher der Archäologie als der Informatik zuordnen: Zusammen mit Altorientalisten der Johannes-Gutenberg-Universität Mainz und der Universität Würzburg arbeitet er daran, antike Schrifterzeugnisse wiederherzustellen. Es handelt sich dabei um Tontafeln der sogenannten „Hethiter“, eines Volkes, das circa 2000 v.Chr. in Zentralanatolien lebte. Die Tontafeln sind im Laufe der Jahrtausende zerbrochen und die Forscher versuchen nun, sie wieder zusammenzusetzen.
Der Computerlinguist Johannes Bernhard will dafür in seiner Masterarbeit eine Software entwickeln, mit der er die Altertumsforscher bei ihrem Vorhaben unterstützen kann: „Mein Programm ähnelt einer Suchmaschine im Internet, in der man einige Wörter als Suchbegriffe eingibt und die dann aus Abermillionen Webseiten die dazu passenden Texte herausfiltert“, erklärt der Student. Dieses Prinzip will er auf Bruchstücke der hethitischen Tontafeln übertragen. Hier soll die Software eine Vorauswahl relevanter Scherben treffen, die dann höchstwahrscheinlich zusammenpassen.
privatIch habe mich schon immer für Geschichte interessiert und finde es spannend, hierfür einen Forschungsbeitrag zu leisten.
Johannes Bernhard
Dabei geht Johannes Bernhard folgendermaßen vor: Im ersten Schritt simuliert er Schrifttafeln, die er virtuell zerbrechen lässt, um einen möglichst zufälligen Haufen an Wortfetzen und Bruchstücken zu erhalten – ganz wie in der Realität. Im nächsten Schritt wendet er verschiedene Ansätze des Maschinellen Lernens auf die virtuellen Scherbenhaufen an, um herauszufinden, welcher die hethitischen Texte am besten wiederherstellen kann. Bernhards Masterarbeit lässt sich so in den Bereich der statistischen Sprachverarbeitung einordnen. „Im Grunde berechnet mein Modell anhand verschiedener Faktoren, wie hoch die Wahrscheinlichkeit ist, dass eine Scherbe zu einer anderen Scherbe passt“, erklärt der Student. Die wiederhergestellten Tontafeln sollen es den Altorientalisten erleichtern, die hethitische Keilschrift darauf zu entziffern und ihre Inhalte zu deuten. „Ich habe mich schon immer für Geschichte interessiert und finde es spannend, hierfür einen Forschungsbeitrag zu leisten“, sagt Bernhard.
Die Masterarbeit entsteht im Rahmen des Studiengangs „Language Science and Technology“ an der Universität des Saarlandes und wird betreut von Professor Dietrich Klakow und Michael Hedderich.
Saarbrücken ist eines der weltweit führenden Zentren für Computerlinguistik und Sprachtechnologie. In vielen Projekten kooperiert die Fachrichtung der Universität am Saarland Informatics Campus mit dem Deutschen Forschungszentrum für Künstliche Intelligenz sowie den Max-Planck-Instituten für Informatik und Softwaresysteme. Studierende der Fachrichtung können eigene Schwerpunkte setzen und sich auf verschiedene Bereiche der Sprachverarbeitung wie Computerlinguistik, Psycholinguistik, Phonetik und Sprachwissenschaft oder Sprachtechnologie konzentrieren. Weitere Informationen: www.uni-saarland.de/studium/angebot/master/lst.html
- Bilder dimamoroz - stock.adobe.com privat