Diktat

Spracherkennung mit Vista - Chance oder Gefahr?

Mit dem neuen Microsoft-Betriebssystem kann man auch sprechen
Von dpa / Marie-Anne Winter

Microsofts neues Betriebssystem Windows Vista wird mit einer eingebauten Spracherkennung ausgeliefert: Es lässt sich ohne Maus bedienen, E-Mails können ohne Tastatur geschrieben werden. Wer dadurch auf dem Geschmack kommt, findet allerdings noch umfangreichere Lösungen bei der Spezialsoftware.

Kolokythas Panagiotis hat schon mit Vista gesprochen: "Wenn ich keine Lust habe, mit der Maus auf den Start-Button zu gehen und das Programm zu suchen, dann kann ich sagen "Word öffnen!" oder "Mail schreiben!"", erklärt der Redakteur der in München erscheinenden Computerzeitschrift PC Welt.

Damit der Rechner Befehle entgegennimmt, müsse lediglich ein etwa einstündiges Übungsprogramm durchgearbeitet werden. Zudem wird eine Software gestartet, die dann im Hintergrund läuft. "Jede Applikation, die Windows öffnen kann, lässt sich per Sprachbefehl bedienen: Man kann damit Fenster bewegen, minimieren, maximieren." Vista sei damit von Haus aus behindertenfreundlich, sagt Kolokythas Panagiotis.

Die Spracherkennung von Windows Vista läuft dem Experten zufolge vergleichsweise zuverlässig. Für professionelle Anwender sei sie allerdings nicht empfehlenswert. Vor allem wer im Arbeitsalltag hin und wieder zum Diktat bitten will, sei mit speziellen Anwendungen derzeit noch besser bedient.

Unbekannte Wörter werden nicht erkannt

Denn auf das Einarbeiten ihres digitalen Sekretärs, wie es bei Vista nötig ist, dürfen die Anwender professioneller Programme nach Aussage der Hersteller jetzt schon verzichten: Weil die Software bereits mit vielen verschiedenen Sprechern vertraut ist, kann sie sich von Beginn an besser auf neue Nutzer einstellen.

Für die aktuelle, elfte Version der Spracherkennungssoftware Voice Pro zum Beispiel lud der Hersteller Linguatec aus München zahlreiche Männer und Frauen zum Vorlesen ins IBM-Entwicklungslabor in Böblingen bei Stuttgart: "Wir haben darauf geachtet, dass die Sprecher aus allen Teilen Deutschlands kamen", sagt Rike Bacher, Computerlinguistin bei Linguatec.

"Das Wort, das erkannt werden soll, wird mit den Mustern verglichen, die dem System bekannt sind", erklärt Martin Held, Softwareentwickler beim Hersteller Nuance aus München. "Wenn das System mit einem Wort konfrontiert wird, das ihm unbekannt ist, kann es das nicht erkennen."

Deshalb sei es unmöglich, hundertprozentige Erkennungsgenauigkeit zu erreichen. Ist der zu erkennende Wortschatz begrenzt, sieht es anders aus: "Ärzte oder Juristen halten sich beim Diktat in einem beschränkten Themenbereich auf. Da gibt es irgendwann keine neuen Wörter mehr", sagt Held. Für diese Zielgruppen bieten die Hersteller ihre Erkennungsprogramme in Kombination mit einem Fachwortschatz an.

Aber auch wenn dem Rechner die Fachbegriffe eines Ägyptologen, der einen Aufsatz diktieren möchte, wie Hieroglyphen vorkommen, ist die Lage aus computerlinguistischer Sicht nicht aussichtslos. "Mit Hilfe der Vokabularanalyse können Sie Texte, die Sie schon einmal geschrieben haben, auf ihr persönliches Vokabular hin analysieren lassen", sagt Rieke Bacher von Linguatec. Das gilt auch für die Software Dragon Naturally Speaking 9 [Link entfernt] von Nuance.

Mehr Rechenpower sorgt für bessere Spracherkennenung

Die Fortschritte bei den Sprachprogrammen führt Martin Held auf die Hardware zurück: "Wir haben viel mehr Ressourcen, mit denen wir arbeiten können." Die Prozessoren seien um ein Vielfaches schneller und der Speicherplatz billiger geworden. Dadurch kann die Software nun zum Beispiel entscheiden, dass die Wortfolge "das rote Haus" viel wahrscheinlicher ist als "das rotem Haus" - obwohl die Soundkarte partout ein "m" vor dem Haus gehört haben will.

Den Anforderungen mobiler Anwender tragen beide Hersteller Rechnung: Sowohl "Dragon Naturally Speaking" als auch "Voice Pro" arbeiten mit digitalen Diktiergeräten und drahtlosen Headsets zusammen. Während der Fahrt am Steuer aufgenommene Diktate lassen sich so automatisch in Text umwandeln.

Microsofts Einstieg in die Spracherkennung sieht Held "eher als Chance denn als Gefahr." Viele Anwender könnten dadurch auf den Geschmack kommen - und sich dann den Programmen der Spezialisten zuwenden, so die Hoffnung. "Wenn Vista hervorragende Qualität liefert, müssten wir uns im Endkundenbereich warm anziehen."

"Voice Pro 11" von Linguatec kostet als "USB-Version" mit USB-Headset und Vokabular für EDV und Wirtschaft 199 Euro. Die "Legal"- und "Medical"-Versionen mit zusätzlichem Fachwortschatz kosten je 399 Euro. Das Heimanwender-Standardpaket von "Dragon Naturally Speaking 9" ist für 99 Euro zu haben, die umfangreichere Version "Preferred" für 199 Euro. Nuance vertreibt auch die zuvor von IBM verkaufte Software "IBM Via Voice". Als Standardversion kostet sie 99 Euro, die "Pro USB"-Version mit USB-Headset ist für 129 Euro zu haben.