Netzwerklautsprecher liefern Daten ins Internet

COMPUTER ⋅ Netzwerklautsprecher wie Google Home oder Amazon Echo werden vor allem in den USA immer beliebter. Sie hören auf die Befehle ihres Besitzers, liefern die Daten aber ins Internet.
05. Dezember 2017, 10:17

Im Jahr 1961 präsentierte IBM seine Shoebox, den Prototypen einer Spracherkennung, die mathematische Rechenoperationen ausführte. Der Wortschatz der Maschine war begrenzt: 16 Wörter, inklusive der zehn Ziffern von 0 bis 9, verstand das Gerät. Die Forschungsabteilung des US-Verteidigungsministeriums finanzierte ab 1971 eine Spracherkennung, die 1000 Wörter verstand. Ein sechsjähriges Kind kennt im Schnitt etwa 13'000 Wörter, ein gebildeter Mensch 60'000.

Heutige Spracherkennungsprogramme wie Siri oder Alexa operieren weitaus komplexer. IBMs Supercomputer Watson wurde mit dem Datenbestand des «Urban Dictionary» gefüttert. Googles Spracherkennung beherrscht 119 Sprachen. Der wenig gesprächige Songwriter Bob Dylan plauderte mit IBM Watson über seine Lyrics. Der Supercomputer fragte Dylan, warum er seine Gitarre mitgebracht habe, wenn er doch gar nicht singe. Mit Hilfe von Sensoren und einer Objekterkennung identifizierte der Computer, dass es sich bei dem Gegenstand um eine Gitarre handelte. Das ist nur ein Werbeclip, doch er zeigt auch das Potenzial künstlicher Intelligenz. Erst vor wenigen Monaten «unterhielten» sich zwei Google-Home-Geräte durchaus selbstreflektiert über Sklaverei und Roboterrechte.

Immer mehr nutzen Netzwerklautsprecher

Mittlerweile nutzen 35 Millionen Amerikaner solche sprechenden Computer, also Netzwerklautsprecher wie Google Home oder Amazon Echo. Bis 2020 werden nach Schätzungen der Analysefirma eMarketer drei Viertel der US-Haushalte ein solches Gerät zu Hause stehen haben. Smarte Lautsprecher und Haushaltsroboter sind die neuen Diener. Die Geräte lassen sich bequem per Sprachsteuerung bedienen. Man muss nur das Aktivierungswort aussprechen: «Alexa, wie wird das Wetter heute?» Laut einer Prognose von ComScore wird bis 2020 jede zweite Suchanfrage per Sprachsteuerung erfolgen.

Damit soll Analphabeten geholfen werden. Laut der UNO sind das weltweit 781 Millionen Menschen, die häufig in Armut leben. Indem sie in ein billiges Handy sprechen und Sprachkommandos erteilen, könnten sie zum Beispiel online ein Bankkonto eröffnen.

Ganz so rosig sind die Aussichten nicht. Datenschützer befürchten, dass IT-Konzerne mit jedem gesprochenen Wort mehr über uns erfahren. Netzwerklautsprecher zeichnen Sätze auf und leiten diese an einen Cloud-Dienst weiter, wo sie von Algorithmen ausgewertet werden. Das Gesagte wird durch gigantische Rechenzentren geschleust. Seitdem Apple 2007 seine Sprachsoftware Siri lancierte, sind Millionen Konversationen auf der ganzen Welt analysiert worden. Die Weltsprache sind Daten. Und je mehr die Computerprogramme lernen, desto besser verstehen sie unsere Sprachkommandos und mithin unsere Sprache.

Adrian Lobe

Anzeige: