wprowadzenie algorytm dźwięki

Jednokanałowa redukcja szumu – przykłady dźwiękowe

Zamieszczone przykłady dźwiękowe przedstawiają możliwości zwiększenia zrozumiałości mowy dla algorytmu jednokanałowej redukcji szumu i dla różnych scenariuszy zakłóceń. Dla każdego scenariusza zaprezentowane są dwa sygnały:

  • Dźwięk nieprzetworzony - sygnał „zebrany” przez przedni mikrofon prawego aparatu słuchowego. Przedni mikrofon prawego aparatu słuchowego stanowi „wejście” algorytmu jednokanałowej redukcji szumu.
  • Dźwięk przetworzony - sygnał wyjściowy z algorytmu jednokanałowej redukcji szumu, którym jest algorytm optymalnego filtru MMSE oparty na założeniu rozkładu Laplace’a dla mowy i rozkładu Gaussa dla szumu.

 

  • pomieszczenie niskopogłosowe
  • głos męski z przodu słuchacza (0°)
  • kierunkowy stacjonarny szum o widmie podobnym do widma ludzkiej mowy umieszczony z prawej strony słuchacza (60°)
  • stosunek sygnału do szumu :  
  • Można zauważyć, że szum tła został efektywnie stłumiony w obu przypadkach (SNR=0 dB i SNR=10 dB). Sygnał mowy wykazuje niski poziom zniekształceń, a redukcja szumi nie wpłynęła na charakterystyki rezydualnego szumu tła, który cały czas brzmi naturalnie.
  • kawiarnia
  • głos kobiecy z przodu słuchacza (0°)
  • rozproszony szum typu cocktail-party (zatłoczona kawiarnia)
  • stosunek sygnału do szumu: Redukcja fluktuującego szumu, jak szum typu “babble” w kawiarni jest dla przetwarzania jednokanałowego dużym wyzwaniem. W tym przypadku postrzegalne są pewne zniekształcenia sygnału mowy, ale redukcja zakłóceń jest wciąż znaczna. W szczególności dla przypadku, w którym SNR=10 dB, nie tylko redukcja szumu jest zauważalna, ale także lekka redukcja pogłosu, która wynika z właściwości większości jednokanałowych algorytmów redukcji zakłóceń.