Pro znělý segment řečového
signálu muz1-AA-frame.CS0
(vše raw data bez hlavičky, fs=16000 Hz, pro načtení do MATLABu
použijte funkci loadbin.m) odhadněte
základní frekvenci v následujících krocích:
analyzovaný segment váhujte Hammingovým oknem,
vypočítejte a vykreslete DFT výkonové spektrum v dB,
určete LPC koeficienty, určete a vykreslete LPC výkonové spektrum v dB (parametry AR modelu
počítejte buď autokorelační metodou pomocí MATLABovské
funkce lpc resp. aryule, nebo
Burgovým algortimem pomocí pomocí MATLABovské
funkce arburg),
DOMÁCÍ PŘÍPRAVA: pro znělý segment muz1-AA-frame.CS0 zobrazte:
- časový průběh signálu - DFT a LPC spektrum
sledujte rozložení nulových bodů a pólů AR modelu,
sledujte vliv preemfáze na rozložení nulových bodů a pólů AR modelu
resp. na napočítané LPC spektrum,
(dále pak již počítejte vždy s aplikovanou preemfází),
pro odpovídající póly (p_1 až p_4) určete hodnotu formantových
kmitočtu (F1, F2, F3 a F4), viz přednáškové
slidy ZRE_pr2_spe_lpc_formanty_HANDOUT.pdf,
hodnoty určených formantových kmitočtů vyneste do grafu a ověřte, že
odpovídají příslušným vrcholům vyhlazeného LPC spektra.
Výsledek: pro znělý segment muz1-AA-frame.CS0 zobrazte:
- rozložení nulových bodů a pólů pro napočítaný
parametry AR modelu s aplikovanou preemfází,
- formantové kmitočty F1 - F4 ve vykresleném LPC spektru
Analýza formantů českých samohlásek
Určete první 4 formanty všech 5 základních českých samohlásek (F1 -
F4) v krátkodobých segmentech délky 32 ms při segmentaci s 50% překryvem. Před segmentací aplikujte preemfázi s koeficientem m=0.97, jednotlivé segmenty pak centrujte a váhujte Hammingovým oknem.
Pracujte se signály mluvčího T16204 - signály jsou v
adresáři K:\ZRE\data\zreratdb\BLOCK162\T16204 nebo v
následujícím archivu zrerat_T16204_vowels_cs0.zip.
Výsledek : Vykreslete pro
mluvčího T16204 :
časový průběh zřetězených hlásek a-e-i-o-u pro 1. realizace všech 5 samohlásek,
časový vývoj kmitočtů pro první 4 formanty pro 1. realizace všech 5 samohlásek,
pro všechny realizace hlásek A1,A2,A3,....,U1,U2,U3 mluvčího
T16204 vykreslete formantový trojúhelník, tj. vypočítané hodnoty vyneste do
grafu v zavislosti F1 = f ( F2 ). Body pro jednotlivé hlásky
odlište barvou.
Pracujte s dalšími signály z
databáze zreratdb, zejména pak s Vámi nahranými signály. Nahrané promluvy převzorkované na 16 kHz (*.CS0
soubory) jsou dostupné v archivu
zrerat_block200_2025_cs0.zip
nebo k přímému použití v počítačové učebně na ČVUT FEL jsou uvedená data k
disposici v adresáři "K:\ZRE\data\zreratdb".
Výsledek
formantový
trojúhelník pro všechny dostupné VLASTNÍ realizace všech 5 samohlásek.
Pozorujte případně odhady formantů v Praatu
(tj. časový vývoj formantů ve spektrogramu signálu, počítejte vyhlazený spectrogram s krátkým časovým oknem délky 5 ms).