Ich spreche, also bin ich.

In zahlreichen Blogs und Newslettern wird derzeit über eine neue Systemlücke von Windows Vista berichtet. Diese Sicherheitslücke besteht aus der im Betriebssystem integrierten Spracherkennungssoftware. Diese Berichte haben mich neugierig gemacht und wollte wissen, wie gut ein aktuelles Spracherkennungsprogramm arbeitet. So kommt es nun, dass dieser Artikel nicht getippt, sondern gesprochen wurde. Zum Einsatz kam Linguatecs Voice Pro 11  Es kam genau so, wie ich es mir vorgestellt hatte. Nach der Installation des Softwarepakets und dem Anschluss des mitgelieferten digitalen Headsets von Sennheiser am USB-Port, begann eine – für mich eher auf aufwändige – Trainingsphase, bevor ich mich ans Diktat dieses Artikels machen konnte. Dieses Aussprachetraining nahm etwa eine gute Stunde Zeit in Anspruch. Es wäre zwar laut Hersteller nicht notwendig, erhöht jedoch die Erkennungsrate beträchtlich. Die Anwendung ist sehr einfach zu bedienen. Nach einem Klick auf das Mikrofonsymbol kann ich direkt mit dem Diktieren beginnen. Wahlweise diktiert man  in das sogenannte SpeakPad, welches erweiterte Korrekturmöglichkeiten bietet, oder direkt in eine beliebige Windows-Anwendung.

Die Spracherkennung verlief jedoch nicht immer fehlerfrei. Ich war zwar erstaunt wie gut meine, sehr dialekt-erfüllte Aussprache erkannt wurde, musste aber dennoch häufig manuell eingreifen und den Text anpassen. Ich werde nun dieses System einige Zeit auf Herz und Nieren testen. Gemäß Hersteller soll die Erkennungsrate mit der Zeit stets besser worden.

Inzwischen habe ich rund eine Stunde lang mit dieser Spracherkennungssoftware gearbeitet. Ich stelle fest, dass die Erkennungsrate deutlich über derjenigen liegt, die zu Beginn der Arbeit zu messen war. Offensichtlich werden auch die manuellen Korrekturen dazu verwendet, die Erkennungsrate zu verbessern. Das Programm kommt sowohl mit einer flüssigen Aussprache, wie aber auch mit einer zerhackten Aussprache zurecht. Das finde ich sehr angenehm, denn man kann sich die nötige Zeit zum Überlegen einräumen.ViaVoice Pro erlaubt aber nicht nur die reine Spracherkennung von Texten, sondern auch die Steuerung von Anwendungen und Betriebssystem. Ein einfacher gesprochener Befehl reicht bereits um ein Programm zu starten, zwischen Anwendungen zu wechseln, innerhalb eines umfangreichen Dokumentes vor und zurück zu blättern, E-Mail und Nachrichten zu erstellen und den Cursor zu steuern. Klar, ein wenig Übung mit der ungewohnten Art mit dem Computer zu sprechen ist erforderlich. Doch das Ergebnis ist erstaunlich.Ein spezielles Augenmerk möchte ich auf die Tatsache legen, dass ich als Schweizer kein Ast reines Deutsch sprechen kann. Meine Aussprache ist immer mit dem typisch schweizerischen Dialekt belegt, und so betrachte ich es als durchaus stark, dass diese Anwendung so gut mit meiner Sprache zurecht gekommen ist.

Abschließend möchte ich erwähnen, dass ich für die letzten 3 Absätze kein einziges Mal zur Maus greifen musste.

Eine Funktion hat bei mir jedoch sehr gemischte Gefühle ausgelöst: per Befehl liest das Programm einen markierten Text vor. Doch die Qualität der Sprachausgabe ist sehr dürftig und entspricht überhaupt nicht der hohen Qualität des restlichen Programmes. Es klingt viel mehr wie eine Roboterstimme aus den frühen achtziger Jahren. Immerhin reicht das Ergebnis, um das erkannte kurz Probe zu hören.

Es gibt aber auch einige kleine Probleme: ich wollte gerade ein englischsprachiges Wort sprechen welches Voice Pop partout nicht verstehen wollte. Da greife ich doch auf den Buchstabiermodus zurück, denke ich mir. Doch irgend was mache ich wohl falsch. Obwohl ich problemlos in den Buchstabiermodus wechseln konnte, schaffte ich es nicht, das besagte Wort zu buchstabieren. Somit greife ich nun in die Tasten und tippe, was mir per Sprache nicht gelingt:

DISCLAIMER: ViaVoice Pro ist ein Produkt, welches von meinem Arbeitgeber im deutschsprachigen Raum vertrieben wird.

 

 

2 Kommentare