Mexiko / Medien / Kultur

Mexiko: Automatisiertes Übersetzungsprogramm für indigene Sprachen entwickelt

mexiko_uebersetzung_indigene_sprachen.jpg

68 Sprachgruppen sollen in das Übersetzungsprogramm integriert werden
68 Sprachgruppen sollen in das Übersetzungsprogramm integriert werden

Mexiko-Stadt. Wissenschaftler des Instituts für Angewandte Mathematik und Systemforschung der Nationalen Autonomen Universität von Mexiko (UNAM) haben ein automatisiertes Übersetzungsprogramm für indigene Sprachen entwickelt. Das hat die UNAM in ihrem offiziellen Blatt bekannt gegeben.

Das Projekt begann 2014, als ein Student, der in direktem Kontakt mit den Wixárika sprechenden Gemeinden in mexikanischen Bundesstaat Nayarit stand, nach Übersetzungsalternativen suchte.

Er bekam Unterstützung von Iván Vladimir Meza Ruiz, Experte für künstliche Intelligenz, Wissenschaftler des Informatikinstituts der UNAM und heute Leiter des Projekts. Zurzeit besteht das Team aus mehreren Studenten und ehrenamtlichen Mitarbeitern, die selbst eine indigene Sprache sprechen. Das Projekt befindet sich in der Phase der Datenaufnahme. Dabei werden in zwei Sprachen gleichbedeutende Sätze in einer Datenbank gespeichert.

Bis heute sind über 10.000 Daten erfasst worden: "Dennoch brauchen wir viel mehr Daten, damit das Übersetzungsprogramm so gut funktioniert wie ein gewohntes Übersetzungsprogramm, beispielsweise Spanisch-Englisch", erklärt Meza Ruiz.

Für die Datenverarbeitung wird ein spezielles Computersystem gebraucht. Die Wissenschaftler stehen vor der Herausforderung, dass einige der indigenen Sprachen vor Kurzem nur gesprochen wurden, sodass es noch keine feste Schreibweise gibt.

Hinzu kommt, dass manche indigenen Sprachen nur von ganz wenig Personen gesprochen werden, während andere Sprachen dagegen eine gewisse Verbreitung haben. Das alles erschwert die Übersetzung. Dennoch "sehen wir, dass es unter der Bevölkerung eine Anerkennung der indigenen Sprachen gibt. Daher ist es wichtig, die Sprachen zu bewahren", betont Meza Ruiz.

Laut dem Nationalen Institut für indigene Sprachen gibt es in Mexiko 68 Sprachgruppen und 364 Sprachvarianten. Das Ziel des Projekts ist, die 68 Sprachgruppen in das Übersetzungsprogramm zu integrieren.

Einige der indigenen Sprachen wie Wixárika bestehen aus zahlreichen Vokabeln, die mit Prefix und Suffix dekliniert werden, die dann die Funktion einer Satzbildung haben, "was eine besondere Herausforderung ist",  führt Meza aus.

Andere Studenten des UNAM-Instituts haben ähnliche Projekte begonnen. So für die Sprache Mazahua, das sogar als GoogleApp benutzt werden kann, oder für die Sprache Mixe, bei der ein Mixe sprechender Student dabei ist, eine Dolmetscher-Methode zu entwickeln.

Bis heute sind die indigenen Sprachen aus der Perspektive der Anthropologie erforscht worden. Für diese Art von Projekten ist die richtige Technologie nötig, aber auch die Einbeziehung von Indigenen, die ihre eigenen Sprachen sprechen.