Lautlose Sprachkommunikation: Ohne Stimme sprechen

Handys in der Öffentlichkeit: ein kontroverses Thema. Im Karlsruher Institut für Anthropomatik und Robotik forschen Tanja Schultz und ihr Team daran, dass private Gespräche in Zukunft privat bleiben.

von Tanja Schultz

Das Internet und die Mobiltelefonie haben unsere Kommunikationsgewohnheiten und -bedürfnisse grundlegend verändert. Mittlerweile gibt es weit mehr Mobil- als Festnetzanschlüsse und viele Menschen sind fast immer und überall erreichbar. Neben vielen Annehmlichkeiten führt das aber bisweilen zu Problemen. Ständiges Handyklingeln stört in Restaurants, in Meetings und öffentlichen Veranstaltungen. Zudem scheuen sich immer weniger Handynutzer, hemmungslos laut in der Öffentlichkeit zu telefonieren. Das Problem der störenden Klingeltöne haben die Hersteller sehr schnell durch die Erfindung des lautlosen Vibrationsmodus gelöst – aber wie schaltet man einen Sprecher stumm? Den Handygebrauch in der Öffentlichkeit einzuschränken oder zu verbieten wäre eine tolle Lösung zur „Lärmentlästigung“, aber das ist für Bürger des 21. Jahrhunderts wohl eher unbefriedigend.

Das Forscherteam im Cognitive Systems Laboratory des Instituts für Anthropomatik und Robotik am Karlsruher Institut für Technologie arbeitet an einer alternativen Technologie, die es Sprechern zukünftig erlauben soll, völlig lautlos zu sprechen und dennoch vom Gesprächspartner am anderen Ende der Leitung verstanden zu werden. Das Prinzip basiert auf der Tatsache, dass Sprache durch die Kontraktion von Muskeln produziert wird, die unseren Artikulationsapparat bewegen. Die dabei entstehenden elektrischen Muskelpotenziale können durch kleine Elektroden an der Hautoberfläche aufgezeichnet werden. Eine Analyse dieser Signale durch geeignete maschinelle Lernverfahren erlaubt es, von den aufgezeichneten elektrischen Potenzialen auf die Bewegungen des Artikulationsapparates und damit auf die Sprache selbst rückzuschließen. Die erkannte Sprache kann dann als Text ausgegeben werden und lässt sich beim Zuhörer wieder hörbar machen. Da dieses Verfahren auch dann Muskelaktivität erfasst, wenn eine Sprecherin nicht hörbar spricht, sondern nur lautlos artikuliert, kann mit diesem Prinzip lautlos gesprochene Sprache erkannt und verarbeitet werden.

Das aktuelle System zur lautlosen Sprachkommunikation verwendet Oberflächenelektroden, die etwas kleiner sind als eine Ein-Cent-Münze. Die erfassten Signale werden von einem mobilen Gerät verstärkt und mit einer eigens entwickelten Software digital verarbeitet. Dabei werden mögliche Störartefakte wie Rauschen, Umgebungseinflüsse und Schwitzen kompensiert. Im Anschluss an diese Signalvorverarbeitung werden mittels statistischer Mustererkennungsverfahren die Beziehungen zwischen den Muskelaktivitätsmustern und den Lautbestandteilen der Sprache modelliert. Diese Modelle werden dann angewendet, um aus den elektrischen Signalen, die der Anwender beim Sprechen erzeugt, eine textuelle Repräsentation des Gesprochenen zu ermitteln. Hieraus kann auf der Zuhörerseite hörbare Sprache synthetisiert werden. Alternativ könnten die gesprochenen Wörter in Textform angezeigt und beispielsweise als SMS versandt werden.

Die Technologie der lautlosen Sprachkommunikation bietet aber noch weitere Vorteile und Anwendungsmöglichkeiten: Da Sprache lautlos produziert wird, können vertrauliche Informationen wie Passwörter und PINs auch dann abhörsicher übermittelt werden, wenn viele Zuhörer in unmittelbarer Nähe sind. Auch ermöglicht die lautlose Sprachkommunikation, Sprache in lauten Umgebungen zuverlässig zu verarbeiten. In solchen Situation versagen bislang traditionelle Erkennungssysteme, weil Sprache durch die Luft übertragen wird, so dass das akustische Sprachsignal durch die Umgebungsgeräusche korrumpiert wird. Dieses Problem wird durch die Aufzeichnung elektrischer Potenziale direkt am Körper des Sprechers elegant umgangen.

Darüber hinaus könnte die lautlose Sprachkommunikation eine Lösung für Menschen bieten, die durch Unfall oder Erkrankung des Kehlkopfes ihre Stimme verloren haben. Eventuell könnten in der Zukunft auch ältere oder schwache Menschen eine Stimmunterstützung oder Stimmkräftigung erfahren. Derzeit benutzen die Forscher am CSL dazu Elektroden, die auf die Haut geklebt werden. In Zukunft könnten diese Sensoren in das Mobiltelefon integriert werden, und in noch fernerer Zukunft möglicherweise unter die Haut implantiert – aber das entscheidet die nächste Generation der Mobiltelefonierer.

s105

Foto: Volker Steger

Prof. Dr.-Ing. Tanja Schultz ist Professorin für Kognitive Systeme am Institut für Anthropomatik und Robotik am Cognitive Systems Lab des Karlsruher Instituts für Technologie. Sie promovierte 2000 mit dem Thema „Multilinguale Spracherkennung“, für die sie 2001 den FZI-Dissertationspreis und 2002 den „Speech Communication Best Paper Award“ erhielt. Seit 2013 ist sie Präsidentin der ISCA, der größten organisierten Vereinigung von Sprachwissenschaftlern weltweit.

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>