Spracherkennung Google & Co. verstehen beim Schwyzer Dialekt nur Bahnhof Am Schwyzer Dialekt beissen sich die Spracherkennungs-Programme noch immer die Zähne aus. Mit frischen Textproben soll das endlich besser werden. Stefan Grüter 02.08.2021, 11.25 Uhr

Exklusiv für Abonnenten

An der nationalen Erhebung auch gefragt: der Schwyzer Dialekt. Bild: Stefan Grüter

Schwierig, schwierig. Wer spricht in unserem Kanton den Original-Dialekt? Die Reichenburgerin, bei der es im Winter «schniit» statt «schneit», der Bächer, der «baut» statt «buut», die Küssnachterin, bei der die 2 eine «zwoi» ist, oder der Muotathaler, der mehr als bis auf «zächä» zählt?

Spielt aber nicht so eine grosse Rolle. In einem schweizweiten Forschungsprojekt unter dem Titel «Kampf der Kantone» entsteht eine Sammlung von Mundart-Aufnahmen. Diese Sammlung verfolgt einen konkreten Nutzen.

«Unser Ziel ist es, mindestens 2000 Stunden schweizerdeutsche Aufnahmen von allen Dialekten zu sammeln. Diesen Datensatz werden wir für Forschungszwecke zugänglich machen, damit Computerprogramme entwickelt werden können, die gesprochenes Schweizerdeutsch verstehen», schreibt das Forschungsteam unter der Organisation von Swiss Association for Natural Language Processing (SwissNLP) mit Sitz in Winterthur.



Für «Speech-to-Text»



Denn bisher können Deutschschweizer oft mit sprachverarbeitenden Systemen nicht einfach sprechen, «wie ihnen der Schnabel gewachsen ist». Bei Schweizer Mundart von Aargau bis Zug oder eben von Bäch bis Muotathal verstehe die Software in der Regel nur Bahnhof. Das liege daran, dass Systeme für die Verschriftlichung gesprochener Sprache (Speech-to-Text) grosse Mengen an Trainingsdaten benötigen, das heisst Audioaufnahmen und die dazugehörigen Transkripte.

«Für Schweizerdeutsch gibt es bisher nicht genug Daten, um entsprechende Computerprogramme zu trainieren.»

Und dies soll sich nun mit der Datensammlung ändern. Für grosse Technologiefirmen wie Google oder Amazon ist der Schweizer Markt viel zu klein, und deshalb ist es für sie wenig attraktiv, eine Lösung zu entwickeln, die Schweizerdeutsch versteht. Für Sprachen wie Englisch und Deutsch liefern diese Methoden bereits hervorragende Ergebnisse mit Fehlerraten unter zwei Prozent, heisst es.



Noch an zweitletzter Stelle



Um möglichst viele Daten zu erhalten, haben die Forschenden mit dem «Kampf der Kantone» einen eigentlichen Wettstreit lanciert. «Im Kampf der Kantone messen sich die Kantone untereinander. Wem liegt der eigene Dialekt besonders am Herzen? Nehmen Sie Ihren Dialekt auf und helfen Sie Ihrem Kanton! Möge der fleissigste Kanton gewinnen! Am Stichtag, 27. August, ermitteln wir den Sieger- Kanton. Dabei berücksichtigen wir, wie viele Aufnahmen aus dem Kanton stammen, wie gut deren Qualität ist – und natürlich auch wie viele Personen überhaupt in dem Kanton leben!», heisst es in der Ausschreibung.

«Der Gewinnerkanton wird mit einem Preis ausgezeichnet. Aber auch Sie können einen Preis für Ihren Beitrag erhalten.»



Unser Kanton hat allerdings noch gewaltig an Boden gutzumachen. Die Rangliste wird derzeit von den Kantonen Wallis (29'791 Punkte) vor Zürich (20'867) und Appenzell Ausserrhoden (14'025) angeführt. Mit 2471 Punkten liegt der Kanton Schwyz an zweitletzter Stelle nur knapp vor dem Jura. Also: «Diä Hindärä vürä näh!» Detaillierte Informationen über das Vorgehen auf www.dialektsammlung.ch