B2M31ZRE - spk ident

English version of this page

Zpět na hlavní stránku | seznam cvičení

B2M31ZRE - cvičení

Identifikace mluvčího na bázi GMM

Úkoly k vypracování:

Úprava verifikace řečníka na bázi GMM
- Upravte verifikaci řečníka na bázi GMM pro rozšířený vektor příznaků.
- Použijte v první řadě 20 MFCC kepstrálních koeficientů bez c[0].
- Do příznakové sady zahrňte též delta koeficienty ( numerický odhad první derivace řádu m z okolních m segmentů). Řád odhadu derivace volte přibližně okolo m = 9. Je možné použít následující funkci diffceps pro odhad delta parametru.
- Volte opět GMM se 6 směsmi a úplnou kovarianční maticí.
- Výsledek :
  - Zobrazte okamžité hodnoty a průměr napočítaného skóre resp. výsledek verifikace pro vaše a cizí testovací promluvy pro případ s rozšířeným příznakovým vektorem s 20 MFCC kepstrálními koeficienty.
  - příznakový vektor rozšiřte o delta parametry a opakujte verifikaci dle postupu výše.
  - Aktualizujte systém pro off-line (on-line) verifikaci mluvčího vytvořený na minulém cvičení.
Vyhledání mluvčího v množině promluv od více mluvčích
- V množině signálů v adresáři "K:\ZRE\data\spksearch_ls2425" nalezněte 10 promluv hlasu vašeho hlasu. V množině je vždy od každého mluvčího 10 promluv.
- Identifikaci vašich promluv pak realizujte na bázi GMM s rozšířeným příznakovým vektorem (je možné použít i přístup se základními GMM, avšak pozor, tímto způsobem bude výpočet možná méně přesný).
- Pro načtení všech promluv použijte skript demo_loadbin_in_cycle.m
- Pro práci mimo síť FEL je možné stáhnout následující archiv spksearch_ls2425.zip, který obsahuje nahrávky testovacích promluv neznámých mluvčích v aktuálním semestru převzorkované na 16 kHz, spolu se seznamem souboru pro zpracování v cyklu, viz skript demo_loadbin_in_cycle.m.
- Výsledek :
  - Seznam 10 rozpoznaných promluv vašeho hlasu, tj. 10 promluv s NEJVYŠŠÍ napočítanou průměrnou logaritmickou pravděpodobností (případně s nejmenší vzdáleností).
  - Seznam dalších 10 promluv (pořadí 11-20) s nejvyšší napočítanou průměrnou logaritmickou pravděpodobností (případně vzdáleností).

B2M31ZRE - cvičení Identifikace mluvčího na bázi GMM

B2M31ZRE - cvičení

Identifikace mluvčího na bázi GMM