Upravte verifikaci řečníka na bázi GMM pro rozšířený vektor příznaků.
Použijte v první řadě 20 MFCC kepstrálních koeficientů bez c[0].
Do příznakové sady zahrňte též delta koeficienty ( numerický odhad první derivace řádu m z
okolních m segmentů). Řád odhadu derivace volte přibližně okolo m = 9.
Je možné použít následující
funkci diffceps
pro odhad delta parametru.
Volte opět GMM se 6 směsmi a úplnou kovarianční maticí.
Výsledek :
Zobrazte okamžité hodnoty a průměr napočítaného skóre resp. výsledek verifikace
pro vaše a cizí testovací promluvy pro případ s rozšířeným
příznakovým vektorem s 20 MFCC kepstrálními koeficienty.
příznakový vektor rozšiřte o delta parametry a opakujte
verifikaci dle postupu výše.
Aktualizujte systém pro off-line (on-line) verifikaci mluvčího vytvořený na minulém
cvičení.
Vyhledání mluvčího v množině promluv od více mluvčích
V množině signálů v
adresáři "K:\ZRE\data\spksearch_ls2122"
nalezněte 10 promluv hlasu vašeho hlasu. V množině
je vždy od každého mluvčího 10 promluv.
Identifikaci vašich promluv pak realizujte na bázi GMM s rozšířeným příznakovým vektorem (je možné použít i přístup na bázi VQ či základních GMM, avšak pozor, tímto způsobem bude výpočet možná méně přesný, jistě výrazně pomalejší v případě VQ).
Pro práci mimo síť FEL je možné stáhnout následující archiv
spksearch_ls2223.zip,
který obsahuje nahrávky testovacích promluv neznámých mluvčích v
aktuálním semestru převzorkované na 16 kHz, spolu se seznamem
souboru pro zpracování v cyklu, viz skript demo_loadbin_in_cycle.m.
Výsledek :
Seznam 10 rozpoznaných promluv vašeho hlasu, tj. 10 promluv s NEJVYŠŠÍ napočítanou průměrnou logaritmickou pravděpodobností (případně s nejmenší vzdáleností).
Seznam dalších 10 promluv (pořadí 11-20) s nejvyšší napočítanou průměrnou logaritmickou pravděpodobností (případně vzdáleností).