![]() |
Laboratoř zpracování řečového signálu |
![]() ![]() |
Vítejte | Historie | Lidé | Výzkum | Projekty | Publikace | Ke stažení | Demonstrace | Vnější styky | Odkazy | Kontakty |
|
Zvýrazňování řeči Výzkum v této oblasti je zaměřen především na odstranění additivního rušení v signálu snímaném v hlučném prostředí. Typické aplikace vyvíjených metod jsou především v komunikačních aplikacích. V první řadě jistě v telekomunikacích v souvislosti s rozvojem mobilní telefonie, tj. zejména při telefonování z běžného prostředí s rušivým pozadím, významné je i zaměření na rušení v automobilu při snímání hands-free sadou. Systémy zvýrazňování řeči nalézají uplatnění i v jiných případech komunikace ve velmi hlučném prostředí, kde je potřeba často dosáhnout i jenom srozumitelnosti přenášené informace, např. v pilotní kabině, při komunikaci mezi lékařem a pacientem při speciálních vyšetřeních jako je CT, apod. Velmi významnou aplikační oblast tvoří použití v pomůckách či náhradách pro sluchově postižené osoby. Konečně potlačení aditivního rušení je důležitých krokem i v případě rozpoznávání řeči, kdy se vliv aditivního šumu snažíme eliminovat již v první parametrizační fázi. ![]() V nejčastějších aplikacích je řečový signál snímán typicky jedním mikrofonem, což je i hlavním důvodem velmi častého použití jednokanálových algoritmů pro potlačení aditivního rušení i jejich popularity. Tyto algoritmy nejčastěji pracují ve frekvenční oblasti na bázi spektrálního odečítání. Ve výzkumných aktivitách našeho pracoviště jsou studovány různé modifikace těchto algoritmů, zejména s ohledem na minimalizaci výskytu parazitních hudebních zvuků ve výstupním signálu. Byl navržen algoritmus rozšířeného spektrálního odečítání, který může pracovat bez detektoru řečové aktivity. ![]() Hlavním přínosem vícekanálových systémů potlačení rušení je překonání principiálních limitů jednokanálových algoritmů, např. v možnosti lepšího potlačení i nestacionárních šumů. Byly studovány systémy se dvěma vstupy aplikovatelné v pomůckách pro sluchově postižené a dále byly vyvíjeny algoritmy pracující s polem čtyř mikrofonů. Následující hlavní skupiny algoritmů jsou předmětem našeho výzkumu: tvarování směrové charakteristiky pole mikrofonů, systémy potlačení na bázi kohereční funkce, systémy potlačení na bázi analýzy a separace nezávislých komponent resp. související podoblasti jako jsou problematika umístění mikrofonů, odhad a kompenzace zpoždění mezi kanály, apod. ![]() Detektory řečové aktivity jsou nedílnou součástí řady systémů zpracování řeči. Typické aplikace jsou jistě v systémech potlačování šumu, kdy se v řečových pauzách odhadují charakteristiky šumového pozadí, dále v rozpoznávacích systémech, kdy detekujeme začátek a konec pormluvy, či v systémech kódování řeči. V této oblasti jsou studovány různé algorimty detekce řeči na bázi energetických, kepstrálních či koherenčních charakteristik, detektory na bázi statistického modelování vybraných příznaků (GMM) či metody využívající systémů umělé inteligence (neuronových sítí). ![]() Důležitou roli při vývoji a testování algoritmů zpracování narušené řeči hrají kritéria hodnotící míru zkreslení řečového signálu či úroveň aditivního šumu. V této oblasti věnujeme velkou pozornost algoritmům odhadu SNR řečového signálu, neboť odhad tohoto kritéria pro nestacionární signál s možným nestacionárním rušením není zcela triviální záležitostí. Druhou skupinu kritérií tvoří metody klasifikující míru zkreslení řečového signálu. Jsou studovány jak algoritmy na bázi SNR, tak algoritmy sledující zkreslení ve spektrální oblasti. |
Poslední aktualizace Út dub 15 17:34:43 CEST 2014 Dotazy nebo připomínky posílejte správci. Údržba.