pte20170425026 Produkte/Innovationen, Technologie/Digitalisierung

Lyrebird: Algorithmus klaut jede Stimme

Eine Minute Audio-Aufnahme reicht zum Nachmachen aus


Mikrofon: Wenig Vorlage erlaubt Stimmenklau (Foto: Günther Gumhold, pixelio.de)
Mikrofon: Wenig Vorlage erlaubt Stimmenklau (Foto: Günther Gumhold, pixelio.de)

Montreal (pte026/25.04.2017/10:30) Das kanadische Start-up Lyrebird http://lyrebird.ai hat einen Algorithmus vorgestellt, der laut den Machern jede Stimme nachmachen kann. Als Grundlage reichen dem Unternehmen zufolge Aufnahmen des Originals von etwa einer Minute Länge. Dann kann das System in der jeweiligen Stimme sagen, was einem beliebt - und das auch mit unterschiedlichem Ausdruck. Als Beispiele dafür müssen Donald Trump, Barack Obama und Hillary Clinton herhalten.

KI lernt nachzuahmen

Lyrebird setzt auf Methoden selbstlernender KI, damit sein System aus einem kompakten Audio-Sample in kurzer Zeit die "Stimm-DNA" eines Sprechers lernt zu ermitteln. Damit ist es dann möglich, diese Stimme beliebige Text mit einem gewünschten emotionalen Ausdruck vortragen zu lassen. Wirklich perfekt sind die veröffentlichten Beispiele zwar noch nicht. Doch ist der Aufwand wirklich so gering wie vom Start-up behauptet, sind die Ergebnisse beeindruckend - und es scheint durchaus plausibel, dass die Stimmsynthese in nächster Zeit noch besser wird.

Laut dem Hersteller erlaubt das System auch, völlig neue Stimmen von Null weg zu entwickeln. Potenzielle Anwendungen umfassen demnach digitale Assistenten mit personalisierter Stimme, das automatisierte Erstellen von Audiobüchern mit bekannten Sprechern oder Stimmen für Animationsfilme und Videospiele. Das Unternehmen wirft zudem die Frage auf, ob Sprachaufnahmen denn noch als Beweismittel geeignet sind. Offen bleibt dabei, ob und wie Lyrebird selbst Missbrauch verhindern will - immerhin scheint auch denkbar, mit einer ausreichend guten Synthese fremder Stimmen Sicherheitssysteme hereinzulegen, die auf Stimmerkennung basieren.

Beeindruckender Vogel

Lyrebird ist nicht das einzige Unternehmen, das an digitaler Stimmsynthese arbeitet. Beispielsweise hat Adobe im November 2016 mit "Project VoCo" ein ähnliches System vorgestellt. Dieses braucht aber 20 Minuten an Sample-Dateien, um eine Stimme nachzubilden. Die Kanadier kommen also mit entscheidend weniger Vorlage aus.

Das Unternehmen selbst ist übrigens nach einem Meister der Nachahmung benannt. Lyrebird ist der englische Name der Leierschwänze. Das sind zwei Arten bodenlebender Waldvögel in Australien. Sie sind dafür bekannt, diverse Geräusch in ihr Gesangsrepertoire aufzunehmen, die sie hören. Nachgeahmt wird dabei so ziemlich alles, vom Gesang anderer Vögel über Musikinstrumente und Motorsägen bis hin zu menschlichen Stimmen.

(Ende)
Aussender: pressetext.redaktion
Ansprechpartner: Thomas Pichler
Tel.: +43-1-81140-314
E-Mail: pichler@pressetext.com
Website: www.pressetext.com
|