Hör mal wer da spricht

Stimmerkennung mit Alexa im Praxistest

Der Sprachassistent Alexa von Amazon erkennt jetzt unterschiedliche Stimmen. Das kann in Haushalten mit mehreren Personen sehr hilfreich sein. Doch wie praxistauglich ist die neue Funktion wirklich?
Von Dennis Knake

Anfang Dezember hat Amazon auch in Deutsch­land die Stim­m­erken­nung für Alexa einge­führt. Damit soll der Sprachas­sis­tent künftig besser unter­scheiden können, wer gerade spricht. Eine wich­tige Funk­tion gerade in Haus­halten mit Fami­lien oder in Wohn­ge­mein­schaften, in denen mehrere Personen das Gerät benutzen. Doch wie gut funk­tio­niert die Stim­m­erken­nung in der Praxis?

Das große Problem aller Sprachas­sis­tenten ist: sie hören immer aufs Wort. Egal wer gerade spricht. Doch in Haus­halten, in denen mehrere Personen leben, kann das zum Problem werden. Ange­fangen bei der Auswahl der Lieb­lings­musik über die Verwal­tung von persön­li­chen Terminen bis hin zu Einkäufen per Sprach­be­fehl. Alexa Stimmerkennung Symbolfoto Alexa erkennt jetzt auch Stimmen. Taugt die Funktion im Alltag?
Foto: Dennis Knake
Wer nicht alleine wohnt, kennt das Problem: Alexa erstellt über die Zeit ein persön­li­ches Geschmacks­profil, etwa über alle abge­spielten Lieb­lings­lieder. Leben mehrere Personen im Haus und nutzen Amazon Echo, entsteht so ein Gemisch aus den Songs, die sich alle Personen gerne anhören. Wer dann nach einer Play­list fragt, bekommt mögli­cher­weise dann nicht mehr genau die Songs abge­spielt, die den eigenen Geschmack am ehesten treffen.

Richtig anstren­gend kann das mit Kindern werden. Kaum hat man die passende Play­list fürs Abend­essen aufge­rufen, kommt das Kind zu Tisch und ruft noch schnell ein „Alexa, spiele Spon­gebob Schwamm­kopf Songs!“ in den Raum. Na Mahl­zeit. Wie sehr wünscht man sich dann, Alexa möge nur noch auf die Stimmen der Eltern hören.

Kann man über den Punkt der Musik­aus­wahl noch hinweg­sehen, so ist die gene­relle Sprach­er­ken­nung spätes­tens dann ein Problem, wenn es um das Pflegen des eigenen Termin­ka­len­ders geht oder Einkäufe per Sprach­be­fehl.

Haus­halts­pro­file unter­scheiden auch weiterhin Nutzer

Bislang musste man mit mehreren Personen auf einem Echo soge­nannte Haus­halts­pro­file konfi­gu­rieren. Dazu benö­tigt jeder Nutzer ein eigenes Amazon-Konto. Der Haupt­nutzer der Echo-Geräte kann dann maximal einen weiteren Nutzer im Haus­halt über die App unter „Einstel­lungen - Alexa Konten - Amazon – Haus­halt“ hinzu­fügen oder wieder entfernen.

Mit dem Befehl „Alexa, Konto wech­seln“ lässt sich dann zwischen beiden Konten hin und her wech­seln. Im Alltag ist das aber wenig prak­ti­kabel, vor jedem Sprach­be­fehl erstmal einmal auf das rich­tige Profil zu wech­seln.

Die Stim­m­erken­nung von Alexa könnte dieses Problem nun lösen. Könnte. Doch ganz so clever ist sie bislang leider immer noch nicht. Zwar wird jetzt je nach erkannter Stimme das Musik­profil indi­vi­duell ange­passt oder nur noch die Nach­richten abge­spielt, die die betref­fende Person noch nicht gehört hat, in den jeweils passenden Termin­ka­lender schreibt Alexa aber immer noch nicht auto­ma­tisch. Hier müssen die Nutzer wie gehabt zunächst in das passende Konto wech­seln. Schade.

Alexa Stimm­profil einrichten

Schreenshot Alexa App Das Stimmentraining wird über die Alexa-App gestartet.
Screenshot
Die Einrich­tung der jewei­ligen Stimm­pro­file erfolgt über die Alexa-App. Auch dafür benö­tigt jeder Nutzer erst einmal ein eigenes Amazon Konto. Auch müssen beide Nutzer sich bereits ein Haus­halts­profil teilen. Über die App geht es nun unter „Einstel­lungen - Alexa-Konto - Regis­trierte Stimmen“ an die Einrich­tung des Profils.

Nach dem Befehl „Alexa, lerne meine Stimme“ bittet der Sprachas­sis­tent nun darum, 10 vorge­ge­bene Sätze nach­zu­spre­chen. Es ist also erhöhte Aufmerk­sam­keit gefragt. Die Sätze werden auch auf einem Echo Show mit Display nicht ange­zeigt. Nachdem die Sätze einge­spro­chen sind, kann Alexa auf die Frage „Wer bin ich“ meis­tens korrekt den aktu­ellen Nutzer iden­ti­fi­zieren. Probleme hatte Alexa bei unserem Test dann, wenn der Nutzer aus größerer Entfer­nung sprach. Zwar wurden Befehle reibungslos erkannt, die Stim­m­erken­nung war dann aber nicht mehr ganz so treff­si­cher. Im Zwei­fels­fall weiß Alexa dann nicht, wer gerade spricht. Führt die Anfrage zwar aus, ordnet diese aber keiner Person im Haus­halt eindeutig zu.

Was ändert sich nach der Stim­m­erken­nung?

Screenshot Alexa App Das Stimmentraining kann wiederholt und neue Nutzer hinzugefügt werden.
Screenshot
Am deut­lichsten wird man die Stim­m­erken­nung bemerken, wenn Alexa den Nutzer künftig bei einigen Befehlen mit Vornamen anspricht. So etwa beim Abspielen der tägli­chen Zusam­men­fas­sung. Also der persön­li­chen Auswahl tages­ak­tu­eller Nach­richten. Lässt man sich die Nach­richten am selben Tag ein weiteres Mal vorspielen, spielt Alexa nur die zwischen­zeit­lich aktua­li­sierten Meldungen vor und lässt die bereits beim letzten Mal vorge­spielten Inhalte weg. Ein anderer Nutzer, der die Nach­richten noch nicht gehört hat, erhält hingegen das voll­stän­dige Programm. Auch beim Start einiger Apps, wie beispiels­weise TuneIn, spricht Alexa den Nutzer mit Namen an.

Fazit

Die Stim­m­erken­nung hat großes Poten­zial bei der Nutzung mit Alexa mit mehreren Personen. Aktuell werden die Möglich­keiten von Amazon aber bei weitem nicht ausge­schöpft. Viel­leicht liegt es auch daran, dass die Erken­nung indi­vi­du­eller Stimmen bei unter­schied­li­chen Entfer­nungen und Geräusch­ku­lissen eine noch größere Heraus­for­de­rung darstellt, als die Erken­nung der Sprach­be­fehle selbst.

Erst wenn mehrere Nutzer nicht mehr in ihre indi­vi­du­ellen Profile wech­seln müssen, sondern die Erken­nung der Stimme ausreicht, um Termine in den rich­tigen Kalender zu schreiben, Listen oder Erin­ne­rungen zuzu­ordnen, ergibt die Nutzung einen Sinn.

Und in der Familie wünscht man sich als Erwach­sener nichts sehn­li­cher, als die Möglich­keit, Kinder von der Nutzung des Echo zu bestimmten Zeiten einfach mal auszu­schließen.

Mehr zum Thema Alexa