Výsledky řešení semestrální úlohy

Filtrace řečového signálu pro detekci základního tónu řeči fo

 

Číslicové Zpracování Signálů

ČVUT FEL Katedra Teorie Obvodů
Aleš Fidranský, Mačkal Adam
let
ní semestr 2000


Úloha 11
Navrhněte pásmovou/dolní propust s propustným pásmem 60 - 300 Hz. Diskuse nad možnými návrhy. Navrhněte způsob měření základního tónu, základní periody řečového signálu pomocí:
Všechny dosažené výsledky srovnejte.


Pásmová propust

Návrh pásmové propusti s propustným pásmem 60 až 300 Hz k filtraci signálu pro získání základní frekvence řeči.

Přenosová funkce pásmové propusti je vypočtena z eliptické aproximace přenosových funkcí filtrů. Návrh pásmové propusti je výsledkem kaskádního spojení horní a dolní propusti s cílem dosažení (nejen) níže uvedených parametrů:

hranice propustného pásma        60 - 300 Hz
hranice nepropustného pásma    
55 - 310 Hz
hraniční hodnoty útlumu               0,2 a 50 dB
vzorkovací frekvence                     8000 Hz
Za účelem testování byl použit řečový signál v binární podobě: s0001.bin a náhodně generovaný signál napodobující bílý šum s odpovídajícím odstupem signálu od šumu hodnotou SNR = 0 dB.

Zobrazení přenosových amplitudových a fázových charakteristik navržené pásmové propusti postupně ukazují následující frekvenční závislosti útlumu v jednotkách dB a fáze v jednotkách radianů. Nejprve jsou charakteristiky vykresleny v celém, vzorkovacím kmitočtem omezeném, rozsahu frekvencí 0 až 4000 Hz a poté v menším omezeném rozsahu frekvencí. V uvedeném detailu přenosových charakteristik je také odlišnou barvou vyznačen idealizovaný průběh frekvenční amplitudové charakteristiky a vymezení rozsahu kmitočtů ve frekvenční fázové charakteristice propustného pásma navržené pásmové propusti.

 

Amplitudová a fázová charakteristika pásmové propusti

 

Detail amplitudové a fázové charakteristiky propustného pásma (60 až 300 Hz)

 

Pro ověření správné funkce pásmové propusti tvořené horní a dolní propustí jsou níže zobrazeny spektrogramy původního řečového a navrženou propustí zpracovaného signálu. Normovaný kmitočet na svislé ose spektrogramu odpovídá kmitočtům v rozsahu 0 až 4000 Hz, vodorovná osa spektrogramu představuje diskrétní časovou posloupnost zobrazení vzorků v signálu.

 

Vizuální ověření funkce filtru zobrazením spektrogramu

 

Všechny tři metody (diskrétní Fourierova transformace, autokorelační funkce a sledování průchodů nulou) byly vyzkoušeny pro původní řečový signál i zmíněný signál obsahující náhodně generovaný šum. Dosažené výsledky použitých metod spolu s aplikovanými průběhy zpracovaných signálů jsou zobrazeny v následujících grafech. Na svislých osách výsledných závislostí jsou vyneseny frekvence v jednotkách Hz a na osách podélných odpovídající čísla segmentů signálů.

 

Diskrétní Fourierova transformace

DFT: segmentace (Hamming, délka segmentu: 512 vzorků, překryv: 3/4 délky segmentu, frekvenční rozlišení 7,81 Hz/vzorek), v každém segmentu se počítá amplitudové spektrum (FFT) a hledá první maximum amplitudy. Vzdálenost prvního maxima od nuly je úměrná hledané frekvenci, ta je ve spektru nejvýznamnější složkou (proto pásmová propust). Na závěr se výsledný průběh vyhlazuje mediánem.


Frekvence naměřená metodou DFT

 

Frekvence naměřená metodou DFT (signál se šumem)

 

Autokorelační funkce

ACF: segmentace (délka segmentu: 512 vzorků, překryv: 3/4 délky segmentu), výpočet autokorelační funkce (symetrická kolem středu), výsledkem je část horní poloviny získaného průběhu odpovídající rozmezí 60 až 300 Hz, nalezení maxima autokorelační funkce a jeho vzdálenosti od nuly (v horní polovině). Nalezená vzdálenost je úměrná fo, výsledek se vyhlazuje mediánem.


Frekvence naměřená autokorelační metodou

 

Frekvence naměřená autokorelační metodou (signál se šumem)

 

Sledování průchodů nulou

Průchody nulou: segmentace (délka segmentu: 512 vzorků, překryv: 3/4 délky segmentu), výpočet průchodů signálu nulou v každém segmentu, nalezený počet průchodů je úměrný fo, výsledný průběh se vyhlazuje mediánem.


Frekvence naměřená sledováním průchodů nulou

 

Frekvence naměřená sledováním průchodů nulou (signál se šumem)

 

Použitá literatura

Komunikace s počítačem mluvenou řečí - Josef Psutka

Webové stránky DZR - cvičení 6

...

Zdrojové soubory do Matlabu ke stažení