pte20250926002 in Forschung

KI-generierte Stimmen klingen wie menschliche

Experiment der Queen Mary University of London zeigt: Unterscheidung ist nicht mehr möglich


Ohr: ist bei KI-Stimmen zusehends überfordert (Bild: Bastian Riccardi, pixabay.com)
Ohr: ist bei KI-Stimmen zusehends überfordert (Bild: Bastian Riccardi, pixabay.com)

London (pte002/26.09.2025/06:05)

KI-generierte Stimmen stehen ihren menschlichen Pendents in nichts mehr nach. Das haben Forscher der Queen Mary University of London nachgewiesen. Sie spielten Probanden echte menschliche Stimmen und zwei verschiedenen Arten von synthetischen Stimmen vor, die mit den neuesten KI-Sprachsynthese-Tools erzeugt wurden. Einige klonten sie aus Sprachaufnahmen echter Menschen, ahmten deren Stimmen also nach, andere generierten sie aus einem großen Sprachmodell. Die Studienteilnehmer erkannten keinen Unterschied.

Allgegenwärtiges Phänomen

"KI-generierte Stimmen sind heute allgegenwärtig. Wir alle haben schon mit 'Alexa' oder 'Siri' gesprochen, die per Telefon gestellten Fragen von automatisierten Kundendienstsystemen beantwortet. Diese Stimmen klingen nicht wie die von Menschen. Aber es war nur eine Frage der Zeit, bis sich das ändert. Jetzt ist es soweit", sagt Forschungsleiterin Nadine Lavan.

Das Generieren von menschlich klingender Sprache erfordere nur minimale Fachkenntnisse, bloß wenige Minuten Sprachaufnahmen und fast kein Geld. Das zeige, wie zugänglich und ausgereift die KI-Sprachtechnologie mittlerweile sei. Dies habe fatale Auswirkungen auf Ethik, Urheberrecht und Sicherheit, insbesondere in Bereichen wie Fehlinformationen, Betrug und Identitätsdiebstahl.

Verbessertes Benutzererlebnis

"Die Möglichkeit, realistische Stimmen in großem Umfang zu generieren, ermöglicht jedoch auch positive Veränderungen. Es könnte Anwendungen für verbesserte Barrierefreiheit, Bildung und Kommunikation geben, bei denen maßgeschneiderte, hochwertige synthetische Stimmen das Benutzererlebnis verbessern", erklärt Lavan.

Videospiele könnten realistischer klingen, nicht so wie ein Update der französischen Version von "Tomb Raider", die im August auf den Markt kam. Darin war die Stimme von Francoise Cadol, die bis dahin der Hauptfigur "Lara Croft" ihre Stimme beliehen hatte, durch eine KI-generierte Stimme ersetzt. Die klang allerdings alles andere als menschlich, was Nutzer empörte.

(Ende)
Aussender: pressetext.redaktion
Ansprechpartner: Wolfgang Kempkens
Tel.: +43-1-81140-300
E-Mail: kempkens@pressetext.com
Website: www.pressetext.com
|