Rauschunterdrückung | videocalling.app

Was ist Rauschunterdrückung?

Rauschunterdrückung (auch als Noise Cancellation oder Rauschreduzierung bekannt) ist eine Signalverarbeitungstechnologie, die verwendet wird, um unerwünschte Hintergrundgeräusche aus dem Audioeingabe des Mikrofons herauszufiltern. Sie stellt sicher, dass nur die Stimme des Sprechers übertragen wird und Ablenkungen wie Tastaturklappern, Computerlüfter, Verkehr oder Bürogespräche entfernt werden.

Wie es funktioniert

Traditionelle Rauschunterdrückungsalgorithmen verwenden Spektralsubtraktion. Sie analysieren die Audiofrequenzen, um konsistente, stationäre Rauschmuster (wie das Brummen einer Klimaanlage) zu identifizieren und sie vom Signal zu subtrahieren.

Moderne, fortgeschrittene Rauschunterdrückung setzt auf Deep Learning (KI). Neuronale Netzwerke (wie RNNoise) werden mit Tausenden von Stunden an Sprach- und Geräuschdaten trainiert. Diese Modelle können menschliche Sprache von Nicht-Sprach-Audio in Echtzeit unterscheiden und unterdrücken effektiv komplexe, nicht-stationäre Geräusche wie ein bellender Hund oder ein weinendes Baby, die traditionelle Methoden oft nicht erfassen.

Rauschunterdrückung in WebRTC

WebRTC-Implementierungen in Browsern enthalten typischerweise ein eingebautes Rauschunterdrückungsmodul als Teil der Audioverarbeitungspipeline. Diese Standard-Unterdrückung ist bei stationärem Rauschen wirksam. Allerdings implementieren viele moderne Videoanruf-Anwendungen zusätzliche, KI-basierte Rauschunterdrückungsschichten (mittels WebAssembly oder Cloud-Verarbeitung), um professionelle Klarheit zu bieten.

Kompromisse

Obwohl sehr effektiv, kann aggressive Rauschunterdrückung manchmal die Sprachqualität beeinträchtigen, Stimmen roboterhaft klingen lassen oder Wortenden abschneiden. Sie fügt dem Anruf auch eine geringe Verarbeitungslatenz hinzu.

Was ist Rauschunterdrückung?

Wie es funktioniert

Rauschunterdrückung in WebRTC

Kompromisse

Verwandte Begriffe