B2M31ZRE cviceni - LPC vokoder

English version of this page

Zpět na hlavní stránku | seznam cvičení

B2M31ZRE cvičení
LPC vokodér

DOMÁCÍ PŘÍPRAVA: (5 bodů)

Zakódování segmentu řeči na bázi LPC
- Pro neznělý a znělý segment řečového signálu vypočítejte parametry autoregresního modelu řádu p=16, tj. autoregresní koeficienty a_k a výkon chyby predikce E_p. Pro výpočet použijte MATLABovské funkce lpc resp. arburg.
- Pro znělý segment určete dle postupu z minulého cvičení hodnotu základní frekvence f_0. Pro neznělé segmenty nastavte hodnotu základní frekvence rovnu 1.
- Napočítané hodnoty uložte do jednoho vektoru encv, a to v následujícím pořadí encv = [ f_0, a_0, a_1, a_2, ...., a_p, E_p ] ;
Realizace LPC enkodéru pro dlouhý signál
- Pro zvolený signál vypočítejte po segmentech hodnotu základního tónu řeči (pitch) včetně detekce neznělých úseků a parametry AR modelu (autoregresní koeficienty a výkon chyby predikce), viz minulá cvičení.
- Volte délku segmentu 30 ms a segmentujte bez překryvu v obou případech, tj. pro výpočet f_0 i parametrů AR modelu.
- Napočítané výsledky uložte do matice encv, jejíž jednotlivé řádky budou obsahovat výše zmíněné parametry zakódovaného signálu pro jednotlivé segmenty, a to v následujícím tvaru encv = [ f_0_1, a_0_1, a_1_1, a_2_1, ...., a_p_1, E_p_1 ; f_0_2, a_0_2, a_1_2, a_2_2, ...., a_p_2, E_p_2 ; .... f_0_i, a_0_i, a_1_i, a_2_i, ...., a_p_i, E_p_i ; .... f_0_L, a_0_L, a_1_L, a_2_L, ...., a_p_L, E_p_L ; ] ;

Odevzdávaný výsledek DOMÁCÍ PŘÍPRAVY:

funkce (skript) pro zakódování signálu s volitelnou délkou segmentu, krokem segmentace, pro obecný vzorkovací kmitočet, jejímž výsledkem bude matice zakódovaných parametrů, kde na každém řádku uchovejte pro každý krátkodobý segment hodnoty základní tón řeči f_0, autoregresních koeficientů a_k a výkonu chyby predikce E_p. Pro neznělé úseky nastavte hodnotu f_0 = 1, pro neřečové segmenty f_0 = 0.
parametry jednotlivých segmentů : pro segmenty uložené v souborech frame_voiced.bin a frame_unvoiced.bin uložte parametry do proměnných encv_voiced a encv_unvoiced. Signály jsou uložené jako raw data bez hlavičky (16-bit signed-integer little endian), fs=16000 Hz, pro načtení do MATLABu použijte funkci loadbin.m.
parametrů delších signálu : vypočítejte parametry pro signály SA106S06.CS0 a T20YYYS1.CS0 (vámi nahraná věta z databáze zreratdb, kde YYY je kód osoby obdržený na prvním cvičení, dostupné v archivu zrerat_block200_2025_cs0.zip) a vypočítané matice parametrů uložte jako proměnné encv_SA106S06 a encv_T20YYYS1. Všechny výše uvedené signály jsou raw data bez hlavičky (16-bit signed-integer little endian), fs=16000 Hz.
Přes WEBové rozhraní na stránkách FEL Moodle (autorizovaný přístup) odevzdejte *.zip archiv, který bude obsahovat vytvořenou funkci pro zakódování signálu a *.mat soubor s napočítanými parametry. Všechny 4 výše uvedené proměnné uložíte do mat souboru např. příkazem save du2.mat encv_voiced encv_voiced encv_SA106S06 encv_T20YYYS1 ;
Termín odevzdání domácího úkolu je do Po 17.3.2025, 8:00 .

Úkoly na cvičení :

Dekódování 1 segmentu na bázi AR modelu (LPC)
- Vytvořte šumové buzení pro generování umělého neznělého segmentu, tj. Gaussovský bílý šum s nulovou střední hodnotou a jednotkovým výkonem.
- Vytvořte umělý neznělý segment filtrací vytvořeného buzení pomocí syntetizujícího filtru AR modelu.
- Výsledek: pro jeden neznělý a znělý segment frame_unvoiced.bin zobrazte:
  - v časové i spektrální oblasti následující signály: původní, buzení, uměle generovaný.
- Vytvořte pulsní buzení pro generování umělého znělého segmentu, tj. sled pulsů s periodou odpovídající L_0 s celkovým jednotkovým výkonem, a segment opět vygenerujte.
- Výsledek: pro jeden znělý segment frame_voiced.bin zobrazte:
  - v časové i spektrální oblasti následující signály: původní, buzení, uměle generovaný.
Realizace LPC dekodéru
- Dekódujte signál z uchovaných parametrů AR modelu. Při dekódování jednotlivých krátkodobých segmentů dejte pozor na následující kroky:
  1. Filtraci realizujte vždy bez překryvu pro délky odpovídající kroku segmentace pri výpočtu parametrů.
  2. Nezapomeňte na uchovávání počátečních podmínek při filtraci na sebe navazujících segmentů, tj. u funkce filter používejte také čtvrtý vstupní a druhý výstupní parametr.
  3. Použijte umělé buzení vygenerované na bázi informace o f_0 v jednotlivých segmentech.
  4. Při generování pulsního buzení nezapoměňte na správnou návaznost uměle generovaných pulsů, tj. první pulz nemůže být vždy na prvním vzorku segmentu.
- Výsledek: dekódovaný signál z uchované matice zakódovaných parametrů pro promluvu SA106S06.CS0 - zobrazte časový průběh a spektrogram původního a dekódovaného signálu.
- Vyzkoušejte umělé buzení pouze šumovým signálem (bez informace o f_0, tj. f_0 = 0)
- Vyzkoušejte umělé buzení se změněnou hodnotou f_0 ve znělých úsecích (tj. pro f_0 = scale*f_0), kde scale je násobná konstanta v rozmezí 0.8 - 1.5.

Další signály ke zpracování

delší souvislé promluvy SA106S06.CS0, SA176S01.CS0, SA002S02.CS0, SA107S06.CS0, SA110S06.CS0, SA114S06.CS0,
(vše raw data bez hlavičky, fs=16000 Hz),
vlastní nahrávky z databáze zreratdb, viz zrerat_block200_2025_cs0.zip nebo "K:\ZRE\data\zreratdb".
on-line nahrané signály , přečtěte např. následující věty:
    "Všechny myši v šedé chýši šedý myšák vede."
    "Jezevec má hezký zvyk, provozuje tělocvik."
    "Jedna - dva - tři - čtyři - pět"

B2M31ZRE cvičení LPC vokodér

B2M31ZRE cvičení
LPC vokodér