Digitální zpracování řeči

Program přednášek, informace o zápočtu a zkoušce, literatura, prerekvizity atp.

Program cvičení - zimní semestr 2007/2008

1. týden - 4.10. VH
Databáze řečových signálů: TIMIT, číslovky, rádio, ELRA, LDC. Signály v Matlabu (fread).

2. týden - 11.10. RČ
Analýza řeči v časové oblasti: krátkodobé charakteristiky, detekce F0, ADPCM

3. týden - 18.10. VH
FFT - vlastnosti, FFT kepstra, LPC kepstra, liftrace (dekonvoluce), vzdálenosti

4. týden - 25.10. RČ
Aplikace FFT ve zpracování řeči: FFT fázový vokodér, transformace ve frekvenci a v čase

5. týden - 1.11. VH
Aplikace kepster: Analýza vzájemné vzdálenosti segmentů 1 slova, srovnání 2 slov, DTW rozpoznávač

6. týden - 8.11. RČ
Potlačování šumu: Banka filtrů a potlačování pomocí FFT vokodéru

7. týden - 15.11. VH
Čas a cesty v Markovových modelech: matice A, výpočet alfa, beta, L

8. týden - 22.11. RČ
LPC: LPC spektrální analýza, odhad řádů AR, LPC vokodér

9. týden - 29.11. VH
Podobnosti zvuků v Markovových modelech: hustoty pravděpodobností b()

10. týden - 6.12. RČ
Klasifikace řečových dat: Detekce formantů, klasifikace samohlásek

11. týden - 13.12. VH
Jazykové modely: Model bigramů slov a bigramů gramatických tříd

12. týden - 20.12. RČ
Syntéza řeči: Webovské syntezátory, Klattův formantový syntezátor

13. týden - 3.1. VH
Prezentace

14. týden - 10.1. RČ
Prezentace


Slidy z vybraných přednášek
(přístup chráněný heslem)
Seznam zkouskovych otazek

Další informace:

HMM
Formantová syntéza
Kvantizace
LPC
Klasifikátory
Klatt, formantová analýza/syntéza
Určování formantových kmitočtů

Některá možná témata semestrálních prací

Dále tu pro vás máme signály nahrané z rádia (vzorkování 16 kHz / 16 bitů, soubory neobsahují žádné hlavičky, jen samotná data, pořadí bytů ve slově je opačné než u PC) - sportovní zpravodajství a zprávy o počasí.

A zde je databáze izolovaných slov - poslední dvojčíslí je číslo mluvčího, první číslice je verze promluvy.

Link na Linguistic Data Consortium