wprowadzenie algorytm dźwięki

Redukcja pogłosu oparta na funkcji koherencji. Działanie algorytmu

Algorytm usuwania pogłosu analizowany w projekcie HeaCom oparty jest o binauralną koherentną filtrację. Estymuje koherencję (tj. podobieństwo sygnałów) pomiędzy sygnałami zbieranymi w lewym i prawym uchu. Estymata jest obliczana w różnych pasmach częstotliwości używając banku filtrów opartego na FFT z nieliniowym mapowaniem częstotliwości przybliżającym skalę Barków. Jako estymata koherencji jest wyznaczana czasowa średnia międzyusznej różnicy faz. Jeśli sygnały są koherentne w danym paśmie częstotliwości, dźwięk powinien być kierunkowy, stąd wzmocnienie w pasmach częstotliwości jest ustawione na wysokie wartości. Z drugiej strony, jeśli koherencja jest niska, jest to dźwięk rozproszony, a pasmo to jest tłumione. Wzmocnienia zależne od częstotliwości są wyznaczone z mocy wektora przesunięć fazowych poprzez zastosowanie wykładnika (między 0.5 a 2) do estymaty koherencji. Wysokie wartości wykładnika oznaczają wydajną filtrację, ale prowadzą do słyszalnych artefaktów. Z powodu geometrii głowy, koherencja dla małych częstotliwości jest zawsze wysoka, niezależnie od rodzaju sygnału. Dla średnich i dużych częstotliwości, koherencja jest niska dla pogłosowych składowych sygnałów (późne odbicia) i dla rozproszonego szumu typu „babble”, podczas gdy jest wysoka dla fali bezpośredniej sygnału użytecznego. Stąd poprzez zastosowanie odpowiednich wzmocnień pogłosowe składowe sygnału oraz rozproszony szum mogą zostać stłumione w odróżnieniu od dźwięku bezpośredniego.

Bibliografia:

Wittkop, T. and Hohmann, V. (2003). Strategy-selective noise reduction for binaural digital hearing aids. Speech Communication, 39:111–138.