pte20251210017 in Forschung

KI-Kopfhörer realisiert mühelose Unterhaltung

Selbst im größten Stimmengewirr blendet das KI-Gadget alle Fremdgeräusche automatisch aus


Intelligenter Kopfhörer: Hightech-Modul erkennt den Gesprächspartner (Foto: Hu et al./EMNLP)
Intelligenter Kopfhörer: Hightech-Modul erkennt den Gesprächspartner (Foto: Hu et al./EMNLP)

Seattle/Suzhou (pte017/10.12.2025/11:40)

Ein KI-gestützter Kopfhörer von Forschern der University of Washington hilft bei Hörproblemen. Betroffene können sich damit ungestört mit ihrem Gegenüber unterhalten, auch im Stimmengewirr einer großen Veranstaltung. Das Team hat einen handelsüblichen Kopfhörer, der Störgeräusche durch Gegenschall unterdrückt, etwa das Rauschen in einer Flugzeugkabine, mit zwei Mikrofonen kombiniert, die zunächst sämtliche Stimmen und andere Geräusche richtungsgetreu aufnehmen.

KI erkennt Gesprächspartner

Schon nach wenigen Sekunden erkennt die KI, mit wem der Nutzer des Kopfhörers sprechen will. Sie analysiert seine Sprache und hebt sie hervor, während sie die übrigen Geräusche unterdrückt. Für den Nutzer entsteht der Eindruck, dass dieser in einem störungsfreien Raum steht und sich mit seinem Gesprächspartner mühelos unterhalten kann. Das Team hat die Technologie auf der Conference on Empirical Methods in Natural Language Processing in China vorgestellt. Der zugrundeliegende Code ist Open Source und als Download verfügbar.

"Wir nutzen die einfache Tatsache, dass zwei Menschen abwechselnd reden, wenn sie in einem Gespräch sind. Das übermitteln die Stereomikrofone an die KI, die daraufhin die Sprechweise des Gesprächspartners erkennt und sich auf diese konzentriert, während sie andere Geräusche ausblendet. Wir haben die KI so trainiert, dass sie den jeweiligen Gesprächspartner erkennt", unterstreicht Forschungsleiter Shyam Gollakota.

Gesprächspartner wird isoliert

Der Prototyp mit dem Namen "Proactive Hearing Assistants" wird aktiviert, wenn die Person, die den Kopfhörer trägt, zu sprechen beginnt. Sofort startet die KI damit, den Gesprächspartner zu identifizieren, indem sie eine "Wer hat wann gesprochen?"-Analyse durchführt und nach zueinander passenden Äußerungen sucht. Das System leitet das Ergebnis dann an ein zweites Modul weiter, das den Partner isoliert und alle anderen Sprecher ausblendet, heißt es in dem Paper.

Das Team um Gollakota experimentiert seit einigen Jahren mit KI-gestützten Hörassistenten. Es entwickelte bereits einen Kopfhörer, der die Stimme einer Person aus einer Menschenmenge herausfiltern kann, wenn der Träger sie ansieht, sowie einen weiteren, der eine "Klangblase" erzeugt, indem er alle Geräusche innerhalb einer bestimmten Entfernung vom Nutzer ausblendet.

"Bei allem, was wir bisher gemacht haben, musste der Nutzer manuell einen bestimmten Sprecher oder eine bestimmte Entfernung auswählen", so Gollakotas Doktorand Guilin Huan. "Was wir jetzt vorgestellt haben, ist eine proaktive Technologie, die die Absichten des Menschen automatisch erkennt", verdeutlicht der Wissenschaftler abschließend.

(Ende)
Aussender: pressetext.redaktion
Ansprechpartner: Wolfgang Kempkens
Tel.: +43-1-81140-300
E-Mail: kempkens@pressetext.com
Website: www.pressetext.com
|