Textshuttle Wie ein Schweizer Start-up DeepL und Google ziemlich alt aussehen lässt Das KI-Unternehmen Textshuttle bietet seine geniale Übersetzungs-Software neuerdings auch gratis im Internet an. watson hat nachgefragt.

Ihre Software soll auch Schweizer Dialekte beherrschen. Im Bild: Samuel Läubli, Simona Todesco, Simon Bucher und Lucas Seiler von Textshuttle (von links). PD

Textshuttle hat letzte Woche einen kostenlosen KI-basierten Übersetzungsdienst lanciert und damit DeepL und Google Translate den Kampf angesagt.

Das junge Team betont, es entwickle seine Software vollumfänglich in der Schweiz und sie laufe auf hiesigen Servern. Man könne damit selbst grössere Textmengen übersetzen, auch in Schweizerdeutsch und Rätoromanisch.

Anzumerken ist an dieser Stelle, dass die Gratis-Version für die Landessprachen, Englisch und Dialekt (in einer Beta-Version) verfügbar ist. Wer etwas «Exotischeres» übersetzen möchte, ist auf die kostenpflichtige Version oder halt doch auf einen Konkurrenten angewiesen.

watson hat die Verantwortlichen gefragt, wie sie auf die verrückte Idee kamen, eine Übersetzungs-App für die zahlreichen schweizerdeutschen Dialekte zu entwickeln, wie sie die von den Usern eingegebenen heiklen Daten schützen und ob auch ihre KI zu Halluzinationen neigt.

Samuel Läubli, Co-Gründer von Textshuttle und technischer Leiter (CTO) des Unternehmens, und Geschäftsführer Lucas Seiler haben die Fragen zusammen beantwortet.

Das Interview

Wie seid ihr auf die verrückte Idee gekommen, einen eigenen Sprachroboter zu entwickeln und damit grosse Techunternehmen herauszufordern?

Weil wir frustriert waren. Martin und Samuel, die Textshuttle aufgebaut haben, sind in der Grundlagenforschung zu KI-Sprachverarbeitung tätig. Im akademischen Bereich hat sich schon 2015 – lange vor DeepL – abgezeichnet, dass der Einsatz von grossen neuronalen Netzen ein qualitativer Quantensprung für die automatische Textübersetzung bringen wird.

Dass diese Technologie dann nur von Firmen im Ausland der breiten Öffentlichkeit zugänglich gemacht wurde, die «kleine» Sprachen wie Rätoromanisch, sprachliche Eigenheiten wie «Strasse» statt «Straße» oder das Corporate Wording eines Schweizer Detailhandelsbetriebs nicht interessiert, hat uns angespornt, mit den hellsten Köpfen der KI-Sprachverarbeitung am Standort Zürich – und bis heute ohne Fremdfinanzierung – unsere eigenen Sprachroboter zu entwickeln.

Warum macht ihr den Schritt, das Übersetzungs-Tool gratis anzubieten, gerade jetzt?

Ganz einfach: Die Schweiz hat eine Plattform verdient, die unsere Landessprachen beherrscht und Inhalte in der Schweiz verarbeitet. Im Jahr 2023 sollte niemand Texte ohne KI-Unterstützung schreiben müssen.

Das Layout ist schlicht, die Bedienung einfach. Screenshot

Es ist natürlich unternehmerisch sehr geschickt, den aktuellen KI-Hype zu nutzen. Wie seht ihr die aktuellen Diskussionen rund um die Risiken und Gefahren von generativer KI?

Wir stören uns selber daran, dass jedes zweite Stück Software heute mit einem KI-Label versehen wird. Je nach Ansicht ist das auch nicht falsch: Die ersten KI-Systeme waren regelbasiert, und so kann man die Bezeichnung je nach Interpretation des Begriffs relativ breit verwenden. Wir sprechen lieber von Machine Learning, bzw. Deep Learning, also dem Einsatz von (inzwischen sehr grossen) neuronalen Netzen, und bei Textshuttle haben wir von Anfang an nichts Anderes gemacht. Wenn wir «KI» sagen, dann meinen wir «echtes, modernes maschinelles Lernen» – und das sieht man, wenn man unser Tool mit anderen Systemen vergleicht, wie zum Beispiel Google Translate oder DeepL.

Im Übrigen sehen wir KI nicht als Hype, auch wenn gerade viel Marketing damit gemacht wird. Nach der digitalen Transformation von 2000 bis 2020 sind wir spätestens mit dem Aufkommen von LLMs etc. am Anfang einer nächsten Disruption, die zurecht als «KI-Transformation» bezeichnet wird. Das sagen nicht nur Schaumschläger. Selbst einigermassen nüchterne Köpfe wie der deutsche Arbeitsminister Hubertus Heil sind inzwischen überzeugt, dass es ab 2035 keinen Job mehr geben wird, der nichts mit KI zu tun hat.

Was ist mit den Risiken?

Generative KI hat durchaus ein Risiko- und Gefahrenpotenzial; gleichzeitig birgt sie enorme Chancen. Wir vertreten die Haltung, dass es als Erstes eine ernsthafte Diskussion über das Thema auf allen Stufen braucht. Das gilt insbesondere für Ausbildungsstätten, aber auch jedes kompetitive Unternehmen braucht im Jahr 2023 eine KI-Strategie. Es ist spannend zu sehen, dass Firmen wie Ringier das inzwischen nicht nur erkannt, sondern gar zur Chefsache gemacht haben.

Hierzu habe ich eine (augenzwinkernde) Zusatzfrage: Kann Textshuttle auch halluzinieren?

Wir haben Halluzinationen in unseren Modellen in den letzten Jahren massiv reduzieren können, sodass das Problem kaum noch erheblich ist – vielleicht «halluziniert» unser System mal noch ein Satzendzeichen in einer Übersetzung, wo im Ausgangstext keines steht. In seltenen Fällen tritt bei uns – und bei allen Mitbewerbern im Bereich der KI-Übersetzung – das Gegenteil auf: Auslassungen, d.h. Informationen im Ausgangstext, die in der Übersetzung weggelassen werden.

Wenn Sprachroboter lügen Als KI-Halluzinationen werden plausibel klingende Unwahrheiten bezeichnet, die Sprachroboter wie ChatGPT erzeugen. Oft erfindet die KI nicht existierende Quellen, stellt Zusammenhänge faktisch falsch dar oder schildert die Faktenlage verzerrt oder schlicht falsch. Das Phänomen wurde mit dem Aufkommen grosser KI-Sprachmodelle wie GPT-3 im Jahr 2022 verstärkt öffentlich wahrgenommen.

Wie steht es bei Textshuttle um den Datenschutz?

Wir zählen renommierte Schweizer Banken und Versicherungen zu unseren Kunden, die uns ihre teils hochsensitiven Texte anvertrauen. Das zeigt, dass wir die Datenschutz-Thematik sehr ernst nehmen. So erfolgt die Übersetzung auf unseren eigenen Servern in der Schweiz. Dadurch haben wir die volle Kontrolle über den gesamten Verarbeitungsprozess.

Wie wird gewährleistet, dass sensitive Daten, die von Usern eingegeben werden, nicht in falsche Hände fallen?

Wir sind spezialisiert auf den Umgang mit sensitiven Daten und setzen eine Vielzahl von technisch-organisatorischen Sicherheitsmassnahmen um. Diese erfüllen auch die hohen Anforderungen unserer Kundinnen und Kunden – insbesondere aus der Finanzbranche. Von diesen werden wir regelmässig geprüft.

Was kann ich mir als sehr Privacy-bewusster User konkret darunter vorstellen?

Um zu verhindern, dass Daten nicht in falsche Hände fallen, ist eine der wichtigsten und wirkungsvollsten organisatorischen Massnahmen, den Kreis der Personen mit Datenzugriff möglichst kleinzuhalten («Need-to-know-Prinzip»). Ausserdem wählen wir Mitarbeitende sorgfältig aus und sensibilisieren sie auf die Privacy-Thematik im Entwicklungsprozess.

Und natürlich haben wir auch eine breite Palette an technischen Massnahmen: Von biometrische Zugangskontrollen zu unseren Servern, Firewalls bis hin zu Weitergabe-Kontrollen, die gewährleisten, dass Daten nicht von Unbefugten gelesen werden können, um nur einige zu nennen. Diese müssen wir gegenüber unseren Kunden regelmässig ausweisen.

Wieso beherrscht Textshuttle Schweizerdeutsch dermassen gut, während sich andere Anbieter die Zähne daran auszubeissen scheinen?

Grosse Firmen fokussieren auf grosse Sprachen. Das ist verhältnismässig einfach, weil KI-Verfahren zur automatisierten Sprachverarbeitung datenhungrig sind. Will heissen: Wenn ich meiner KI 100 Millionen Sätze zeige, die Menschen vom Englischen ins Deutsche übersetzt haben, kann sie mühelos lernen, diese zu imitieren – sie muss weniger generalisieren, weil sie für fast jedes Wort in fast jedem Kontext ein Beispiel sieht.

Bei Sprachen wie Rätoromanisch oder bei Schweizer Dialekten ist das anders: Es gibt auf der ganzen Welt wohl kaum 100 Millionen Sätze, die je vom Englischen ins Berndeutsche übersetzt wurden. Ganz zu schweigen davon, dass Stadtbernerinnen und Emmentaler den gleichen Satz unterschiedlich schreiben würden.

Im Bereich des maschinellen Lernens ist das für uns eine spannende Herausforderung. Wir haben auf der Basis von Grundlagenforschung an der Universität Zürich unter anderem Verfahren entwickelt, mit denen neuronale Netze – auf denen moderne KI-Anwendungen basieren – aus viel weniger von Menschen gemachten Übersetzungen viel mehr lernen können. Das ist aber erst der Anfang: Unsere KI wird insbesondere für Schweizer Dialekte besser, je mehr Menschen auf unserer Plattform mit ihr arbeiten.

Textshuttle beherrscht 20 Sprachen, aber... Die Übersetzungs-App beherrscht in der kostenpflichtigen Business-Ausführung folgende Sprachen: Chinesisch, Dänisch, Deutsch, Englisch, Französisch, Italienisch, Japanisch, Koreanisch, Niederländisch, Norwegisch, Polnisch, Portugiesisch, Rätoromanisch, Russisch, Schwedisch, Slowenisch, Slowakisch, Spanisch, Tschechisch und Ungarisch.

Bezüglich Finanzierung: Verstehe ich das richtig, dass es eine Quersubventionierung über die kostenpflichtige Business-Lösung gibt?

Es ist im Gegenteil eine Investition in unsere Business-Lösung! Nun haben wir die Möglichkeit, neue Features (wie etwa eine Gender-faire Sprache) der Öffentlichkeit zur Verfügung zu stellen und so zu optimieren, dass sie den professionellen Ansprüchen einer Übersetzerin bei einer Schweizer Versicherung genügen.

Was könnt ihr zum Stromverbrauch von Textshuttle sagen?

Unsere Sprachmodelle sind bedeutend schneller und energieeffizienter als beispielsweise die Modelle hinter ChatGPT, weil sie auf Übersetzungsaufgaben spezialisiert sind. Die Anwendungsfelder werden sich aber auch bei Textshuttle sehr bald erweitern, z.B. wenn es um das Redigieren von Texten in der gleichen Sprache geht. Beispiel: Aus einem komplizierten Zeitungsartikel macht KI eine Version in Leichter Sprache oder in Gender-fairem Deutsch.

Was ist damit gemeint?

Grosse neuronale Netze (z.B. LLMs) können unterschiedlich «gross» sein – die optimale Anzahl Parameter definieren und optimieren wir. Wenn wir das Angebot auf unserer Plattform in Zukunft auf Anwendungen, die über klassische Übersetzung hinausgehen, ausweiten, werden gegebenenfalls auch die Netze und damit der Stromverbrauch grösser. Es ist aber damit zu rechnen, dass dies durch effizienter werdende Hardware kompensiert oder zumindest abgefedert werden kann.

Hand aufs Herz: Wie viel Strom wird verbraucht?

Der energieintensivste Teil unserer Verarbeitungskette sind die Maschinen, auf denen die eigentliche Übersetzung stattfindet. In unserer aktuellen Skalierung brauchen diese Maschinen bei voller Auslastung ca. 4200 kWh Strom pro Monat. Sie sind in der Schweiz stationiert und werden mit Strom aus 100 Prozent erneuerbarer Energie (vorwiegend Wasserkraft) betrieben. Den Übersetzungsbedarf der Schweiz sollten wir, selbst wenn einst sehr viele Menschen unsere Plattform nutzen sollten, damit abdecken können.

Es heisst, man könne bei Textshuttle «grössere Textmengen und mehr Dokumente übersetzen, als es bei anderen kostenlosen Angeboten möglich ist». Konkret?

Registrierte User können auf textshuttle.com beliebig viele Texte mit einer Länge von bis zu 15’000 Zeichen (gegenüber 5000 bei DeepL) übersetzen. Darüber hinaus können sie drei Dokumente pro Tag übersetzen, bei DeepL sind lediglich drei Dokumente pro Monat möglich. Übersetzte Dokumente sind bei Textshuttle editierbar und werbefrei.