13. Dezember 2005 - Von BSt in Feature | Beitrag Seperat Öffnen
In der Ausgabe des MSDN-Magazins für Januar 2006 werden die Möglichkeiten der sprachlichen Interaktion mit Windows Vista vorgestellt. Der Benutzer wird hiernach Windows Vista mit vordefinierten Sprachkommandos steuern können. Auch Menüs, Knöpfe und andere Bedienelemente werden durch sprachliche Interaktion betätigt.
Vordefinierte Kommandos werden etwa für den Aufruf und Wechsel von Applikationen verwendet. So könnten Kommandos wie „Start Notepad“ und „Switch to Calculator“ das entsprechende Verhalten von Windows Vista auslösen und steuern. Für Menüelemente wären analog hierzu Kommandos wie „File“ und „Open“ einsetzbar.
Der Artikel beschreibt auch die Emulation des Keyboards und der Maus durch Sprachkommandos. Beispielsweise seien Spracheingaben wie „Press shift control left arrow 3 times“ durchaus möglich.
Windows Vista werde zudem einen integrierten Sprachkonverter besitzen. Dieser wandelt die Äußerungen des Benutzers in Text um. Alle Editierkommandos dieser Textverarbeitung können sprachlich aufgerufen werden.
Interessant hierbei ist die in dem Artikel beschriebene direkte Korrektur von Wörtern eines Textes, die vom System unter Umständen falsch „verstanden“ worden sind: Eine Berichtigung wird durch Kommandos wie etwa „Correct Robot, Robert.“ durchgeführt oder sogar einzeln buchstabiert. "Spell it R, O, B, E, R as in rabbit, T as in telephone.", ist hierzu ein Beispiel des Artikels. Auch die Navigation durch den Text werde an Hand von Sprachkommandos vorgenommen.
Das sprachliche User-Interface werde insgesamt „unaufdringlich“ eingesetzt und solle dem Benutzer jederzeit die volle Kontrolle über das System garantieren. Zu diesen Kontrollmechanismen gehören ein Mikrofon-Status (beispielsweise kann ein Sleep-Modus für das Mikrofon aktiviert werden) und Text-Meldungen, die dem Benutzer mitteilen, was das System gerade tut. Zusätzlich werde ein Interface eingesetzt, das „zurückfragt“, wenn ein Sprachkommando nicht eindeutig interpretiert werden konnte – das System lernt jedoch in diesen Fällen und verbessert sich so im Laufe der Zeit.
Per Tutorial wird der Benutzer in das Spracherkennungssystem eingeführt. Hier kann er die Basiskommandos erlernen. Das System könne auch Texte (Dokumente, Emails etc.) des Benutzers „durchlesen“ und so sein „Sprachmodell“ feststellen, also die Ausdrucksweise des Benutzers erkennen.
Primär ist das System für Benutzer gedacht, die auf diese Art der Interaktion angewiesen sind, also keine Maus oder ein Keyboard einsetzen können. Die Erwartungen, die an das System gestellt werden, sind also enorm – das System muss uneingeschränkt fehlerlos funktionieren, damit eine reibungslose Kommunikation und Interaktion stattfinden kann. Zudem muss sich das System „dezent“ verhalten, damit der tägliche Einsatz nicht belastend wird. Nicht ohne Grund wird in dem zitierten Artikel auf die „Unaufdringlichkeit“ des Systems hingewiesen: Ein permanent eingeschaltetes System, das vielfach den Benutzer falsch versteht und nachfragen muss, wird für den Benutzer schnell zu anstregend. Auch die Spracheingabe, das Sprechen an sich, ist auf Dauer kraftraubend und erfordert eine erhöhte Konzentration.
Quelle:
Exploring New Speech Recognition And Synthesis APIs In Windows Vista
Tweetback für diesen Beitrag? Poste folgende URL http://tinyurl.com/9gmjw6 in deinem tweet.
Dieser Blog ist ein rein kostenloses und non-kommerzielles Angebot und wurde von TYPO3 Agentur - Bergisch Media realisiert. - Impressum
1. christian schrieb am 15. September 2007 um 00:18
vista ist ein krampf. plug and play - das gab' es einmal; jetzt kann man auch mit vista sprechen - doch wie man das mikrofon angeschlossen kriegt, bleibt expertensache.
vista sucks.