Sprachassistent

Wie funktioniert Alexa, Siri und Co.

In immer mehr Haushalten begleitet ein smarter Sprachassistent von Amazon, Google, Apple und Co. den oder die Bewohner durch den Tag, erledigt Aufgaben, spielt auf Wunsch die Lieblingsmusik oder schaltet auf Zuruf das Licht ein und aus. Außerdem übersetzt er auf Wunsch diverse Fremdwörter, hilft bei der Suche nach dem richtigen Rezept oder informiert uns über den zu erwartenden Verkehr auf dem Weg in die Arbeit. Doch haben Sie sich schon einmal gefragt, wie die Technik dahinter funktioniert?

Warum brauche ich eine Internetverbindung?

Damit Alexa und Co. Ihre Sprachbefehle ausführen können, muss das Gerät - zumeist per WLAN - mit dem Internet verbunden sein. Dies hat den Hintergrund, dass die Befehle nicht im Sprachassistenten selbst abgewickelt werden, sondern auf den Servern von Google, Amazon und Co.
Ohne eine aktive Internetverbindung ist ihr smarter Lautsprecher maximal ein einigermaßen gut klingender Bluetooth-Speaker, der jedoch bereits daran scheitert, Titel per Sprachbefehl zu überspringen oder auf Zuruf Ihre Lieblingsmusik wiederzugeben. Stört es Sie, wenn Alexa permanent online ist, dann lassen Sie lieber die Finger davon.

Wie funktioniert ein Sprachassistant im Detail?

Der wohl beliebteste Sprachassistent, Amazons Echo, verfügt über sieben Mikrofone, die unter der Haube verbaut sind. Im eigentlichen Sinn ist der Echo nämlich nichts anderes, als ein Lautsprecher mit eingebauten Mikrofonen. Die sind auch immens wichtig für die Funktionalität, denn damit werden die von Ihnen gesprochenen Worte aufgezeichnet, etwaige Umgebungsgeräusche so gut als möglich herausgefiltert und anschließend in Windeseile in die Cloud geladen.

Denn das Gehirn von Alexa befindet sich online und nicht etwa im Echo selbst. Auf den Servern von Amazon werden die gesprochenen Worte erkannt und in textliche Form gebracht. Ein Dienst namens „Alexa Voice Services“ analysiert den Befehl und reagiert auf bestimmte Schlüsselwörter. Im Befehl „Alexa, brauche ich morgen einen Regenschirm?“ sind dies die Worte „morgen“ und „Regenschirm“. Diese Begriffe werden an die jeweiligen Apps und Dienste weitergeleitet, sodass Sie in kürzester Zeit eine Antwort bekommen. Damit die Zeit zwischen Befehl und Antwort zumeist nur wenige Zehntelsekunden beträgt, müssen alle Zahnräder ineinander greifen und alles blitzschnell gehen. Denn nur so ist die Verwendung eines Sprachassistenten ein Erlebnis. Positiv zu erwähnen ist auch die Tatsache, dass Alexa in der Lage ist, dazuzulernen.