Vorschau
Orientierung
Mittwoch, 21. Februar 2024
Internationaler Tag der Muttersprachen

Sprache bedeutet Identifikation

Wissen Sie, was Apfelbaum auf Obersorbisch heißt? Nein? Dann finden Sie die Übersetzung im Onlinewörterbuch soblex.de. Doch wie übersetzen Sie: Der Apfelbaum blüht bereits? Auch dabei kann Ihnen ab März geholfen werden. 2021 geht das erste digitale Übersetzungsprogramm für Sorbisch ans Netz.

Die Sorben bilden die letzte einheimische slawische Sprachgemeinschaft in Deutschland. Sie siedelten schon in der Lausitz, als der Einfluss der deutschen Sprache nur bis an die Elbe reichte. Dennoch sind die Sorben eine unbekannte Minderheit. Zum einen, weil es nur noch relativ wenige von ihnen gibt (insgesamt sind es ca. 25.000 Sprecher), zum anderen, weil sie regional in der Lausitz konzentriert sind.

Das stellt sie vor erhebliche Herausforderungen. Die wichtigste: Der Erhalt der Sprache als zentrales Identifikationsmerkmal. Zwar gibt es noch viele Muttersprachler, aber mittlerweile kann jeder Sorbe auch Deutsch. Im täglichen Verkehr außerhalb der eigenen Gemeinschaft wird daher die Mehrheitssprache gesprochen.

Die Sprache bewahren

Das Sorbische soll bewahrt werden. Ein Baustein hierfür ist ein neuer OnlineÜbersetzer für Obersorbisch-Deutsch und umgekehrt. Laut Judith Wenk aus Bautzen, die das zweijährige Projekt bis Ende 2020 koordiniert hat, soll damit der Zugang zur Sprache erleichtert werden. Außerdem soll es weitere Anreize schaffen, sie zu erlernen. Deswegen wird das Projekt durch die Stiftung für das sorbische Volk gefördert, die Mittel des Bundes sowie der beiden Länder Sachsen und Brandenburg erhält. Sie fördert damit das sorbische Kultur- und Sprachgut.

Obwohl die Sorben mittlerweile eine anerkannte Minderheit sind und das Sorbische in den Verfassungen der Länder Brandenburg und Sachsen einen besonderen Schutz genießt, ist es vom Aussterben bedroht. Seit dem 19. Jahrhundert nimmt die Zahl der Sprecher immer weiter ab. Zum Vergleich: Am Ende des genannten Jahrhunderts waren es laut dem Volkskundler Arnošt Muka noch 100.000 Sorben.

Vorschau
Judith Wenk leitete das Team, das den Sorbisch-Übersetzer entwickelte

Translator für Sprachlerner und Übersetzer

Judith Wenk gehört zu denen, die eine zweisprachige Schullaufbahn hinter sich haben. Mit zwei Muttersprachen aufgewachsen, besuchte sie bilinguale Bildungseinrichtungen: Kindergarten, Grund- und Mittelschule sowie das Sorbische Gymnasium in Bautzen. Später studierte sie neben Germanistik vor allem Slawistik, abschließend mit einem Schwerpunkt auf Westslawistik. Danach wirkte sie in zwei Verlagen.

Beim Aufbau des Online-Übersetzers wurden vor allem zwei Zielgruppen in den Blick genommen: Auf der einen Seite Menschen, die Sorbisch lernen. So gibt es in der Lausitz die Möglichkeit, in Sprachkursen Sorbisch zu erlernen. Die zweite Gruppe sind Übersetzer. Diesen kann der Translator beim Formulieren eine Hilfe sein und die Arbeit erleichtern.

Angesiedelt war das Projekt beim WITAJ-Sprachzentrum in Bautzen. Die erste Idee kam dort schon 2016 auf. Es dauerte dann einige Jahre, bis das Konzept konkrete Gestalt annahm und die Gelder hierfür eingeworben wurden.

Wie lernt ein Computer?

Die Konzeption des Translators stellte das Team um Judith Wenk vor zahlreiche Herausforderungen. „Normalerweise nutzt ein Übersetzungsprogramm mehr als zwei Millionen parallele Sätze“, so die Projektverantwortliche. Das bedeutet: Ein Satz wird in beiden Sprachen (obersorbisch und deutsch) in das Programm eingegeben. Dabei ist darauf zu achten, dass der Algorithmus alle Wörter in ihrer grammatikalischen Struktur richtig erkennt. Optimal für das Programm sind daher, soweit möglich, wörtliche Übersetzungen.

Bei einem Wechsel von einer slawischen zu einer germanischen Sprache hat das einige Schwierigkeiten zur Folge. So lässt sich im Sorbischen die Neigung der deutschen Sprache, Wörter zusammenzuziehen, häufig nicht übertragen: Aus „weltweit“ wird dann „überall auf der Welt“. Was einfach klingt, ist für ein Programm schwierig zu lernen. Auch kennt das Sorbische den Dual, also eine eigene grammatikalische Konstruktion für ein Paar. Das Programm muss dann lernen, dass es den Dual in den deutschen Plural verändert, aber nicht den deutschen Plural immer in einen Dual. Zu jeder Form eines Wortes benötigt das Programm daher mindestens drei Sätze, um am Ende möglichst fehlerarm zu arbeiten.

Die Sätze müssen erst einmal gefunden, auf ihre jeweilige grammatikalische Richtigkeit und Passgenauigkeit kontrolliert und dann in das Programm eingespeist werden. Bei einer kleinen Sprache wie dem Obersorbischen ist es jedoch illusorisch, in einem so kurzen Zeitraum zwei Millionen parallele Sätze entsprechend aufzubereiten. Gleichzeitig müssen möglichst viele Themenfelder wie Musik, Sport, Alltag und Politik abgedeckt werden. Bis Ende 2020 ist es gelungen, 187.000 zweisprachige Sätze einzugeben. Auch wenn das Projekt damit im Wesentlichen abgeschlossen ist, sollen in den kommenden Jahren mehr Sätze dazu kommen.

Während Judith Wenk für die sprachliche Seite zuständig war, kümmerten sich bis zu zwei IT-Experten um die technische Realisierung des Übersetzungsprogramms. Denn die Lernfähigkeit der Technik setzt einen komplexen Algorithmus voraus.

Ursprünglich arbeitete das Team mit dem statistischen Microsoft Translator Hub. Als dieser durch den neuronalen Custom Translator, ebenfalls von Microsoft, ersetzt wurde, wurde das sorbische Projekt zu klein und dort nicht mehr beachtet. Das benötigte Minimum an parallelen Sätzen beträgt 250.000, um gut arbeiten zu können. Diese Größenordnung war freilich in der festgesetzten Zeit nicht zu erreichen. Aus diesem Grunde mussten die Verantwortlichen auf Alternativen ausweichen: Die IT entschied sich schließlich für zwei Programme, die aber für die spezifischen Bedürfnisse noch intensiv bearbeitet werden mussten. Mit Erfolg.

Vorschau
Ein kleines Mädchen in der Schleifer-Tracht

Geplanter Start: März

Derzeit befindet sich das System noch in der Testphase. Unter anderem soll erprobt werden, ob es einer intensiven Auslastung gewachsen ist. Fällt der Test positiv auf, wird der Translator im März auf einer eigenen Webseite veröffentlicht. Doch das Projekt betrifft erstmal nur das Obersorbische. Deswegen wird es im nächsten Schritt auch eine Webseite für das Niedersorbische geben. Die bisherige Projektverantwortliche wird diesen Prozess aber nicht mehr begleiten. Sie arbeitet mittlerweile für die katholische sorbische Wochenzeitschrift Katolski Posoł. Die Pflege der sorbischen Sprache und Kultur ist in der Lausitz dennoch ein bleibender Auftrag.