

Googles Lyra: Neuer Codec ermöglicht gute Sprachqualität mit 3 Kbit/s
Google stellt mit Lyra einen Sprach-Codec vor, der gute Qualität bei extrem geringem Datenverbrauch bringt. Genauer schafft es Lyra selbst mit nur 3 Kbit/s eine Stimme klar, verständlich und natürlich klingen zu lassen.
Wäre Lyra, Googles neuer Sprach-Codec, gemeinsam mit dem Video Codec AV1 bereits Ende der 1990er aufgetaucht, hätte ein 56k-Modem für heitere Videotelefonie mit Hunz und Kunz gereicht. Das bedeutet nicht, dass Lyra heute nutzlos ist. Im Gegenteil: Da längst nicht alle Menschen auf dieser Welt mit Schweizer Internet-Geschwindigkeiten gesegnet sind, wird Lyra einiges verändern.
Technisch gesehen können, um die Qualität von Video Calls und Sprachanrufen zu verbessern, stärkere Backhaul und neue Funktechnologien helfen. Oder neue Sprach-Codecs, die selbst bei minimalen Datenraten von nur drei Kilobit pro Sekunde noch immer eine klare und keinesfalls nach Roboter klingende Stimme liefern. Googles neuer Codec Lyra kann genau das – er kann zur Entlastung von Netzwerken beitragen.
Bei Lyra handelt es sich nicht um eine Wellenform-Komprimierung wie bei Codecs, die bei Musik eingesetzt werden. Allerdings könnte Lyra dennoch eines Tages dazu im Stande sein, auch anderes als Sprache zu übertragen. Denn Google ist gewillt, daran zu forschen, wie sich die vorliegende neue Technologie zu einem Allzweck-Audiocodec mit niedriger Bitrate wandeln könnte.
So funktioniert Lyra: Sprache mit minimalen Datenmengen rekonstruieren
Wie kann Google gute Sprachqualität bei so geringer Datenrate garantieren? Die Antwort ist, wie so oft in der Techbranche, eine altbekannte Allzweckwaffe: KI.
Kurz: Google verwendet traditionelle Codec-Techniken und erweitert diese mit neuen Methoden des maschinellen Lernens.
Die Google-Mitarbeitenden Alejandro Luebs (Software Engineer) und Jamieson Brettle (Product Manager von Chrome) schreiben dazu weiter:
Damit Lyra en- und decodiert werden kann, benötigt es übrigens nicht zwingend einen Cloud Server. Ein aktuelles Mittelklasse-Smartphone soll genügend Leistung bringen, damit der Sprach-Codec in Echtzeit On-Device läuft. Bei der Verarbeitung der Daten soll dabei eine Latenz von ca. 90 Millisekunden vorliegen – was auch im Rahmen anderer Sprach-Codecs liegt.
So gut klingt Lyra im Vergleich
Wer gerne Probehören möchte, wie Lyra klingt, kann dies im Google AI Blog tun.
Der tägliche Kuss der Muse lässt meine Kreativität spriessen. Werde ich mal nicht geküsst, so versuche ich mich mittels Träumen neu zu inspirieren. Denn wer träumt, verschläft nie sein Leben.
Vom neuen iPhone bis zur Auferstehung der Mode aus den 80er-Jahren. Die Redaktion ordnet ein.
Alle anzeigen