Laboratoř zpracování řečového signálu česká verze
english version
Vítejte | Historie | Lidé | Výzkum | Projekty | Publikace | Ke stažení | Demonstrace | Vnější styky | Odkazy | Kontakty

Historie skupiny

Skupina zpracování řeči vznikla v roce 1981. V počáteční fázi byl výzkum zaměřen na analýzu a syntézu řečového signálu. Pro syntézu se používaly algorimy založené na kódování tvaru vlny (wave shape coding). Výsledkem bylo několik syntetizátorů s malým slovníkem a velmi kvalitním výstupem. Nejvýznamnější produkt tohoto období byl rozpoznávač izolovaných číslovek na bázi skrytých Markovovských modelů (HMM) nezávislý na mluvčím a implementovaný na modulu s TMS320E17. V následující době byl výzkum rozšiřován na další problematiku z oblasti rozpoznávání řeči, tj. na zlepšení a návrh nových možností parametrizace pro účely rozpoznávání, na zvýšit množství rozpoznávaných slov vedoucích až k aktuálním ropzoznávačům spojité řeči s velkým slovníkem. Byly také studovány algoritmy na bázi neuronových sítí s aplikacemi v rozpoznávání řeči, a to především na úrovni extrakce příznaků. Velká pozornost je průběžně věnována základům fonetiky a lingvistiky, které jsou nedílnou součástí navrhovaných algoritmů.

V návaznosti na výzkum v oblasti obecné analýzy řečového signálu byla od roku 1992 věnována velká pozornost zpracování řeči narušené šumem. První projekt v oblasti zvýrazňování řeči byl zaměřen na potlačování šumu v řeči pro komunikační účely a byl řešený v rámci spolupráce s firmou US WEST. V rámci těchto úloh byla rovněž řešena interdisciplinární problematika předzpracování řečového signálu pro sluchové pomůcky a kochleární implantáty. Výzkum v oblastech rozpoznávání a zvýrazňování řeči logicky vyústil v řešení problematiky rozpoznávání řeči v reálných podmínkách. Tzv. robustní rozpoznávání řeči se stalo jednou z nejvýznamnějších výzkumných aktivit skupiny. Hlavní pozornost je věnována rozpoznávání v prostředí jedoucího automobilu a rozpoznávání po telefonní lince.

Od roku 1999 byla významná aktivita skupiny věnovaná sběru velkých řečových databází v reálných podmínkách. Skupina se aktivně zapojila do několika evropských projektů, zejména INCO-Copernicus 977017 Eastern European Speech Databases for Creation of Voice Driven Teleservices (SpeechDat-E) a FP4 IST-1999-10003 SPEECON - Speech Driven Interfaces for Consumer Applications a v rámci těchto projektů vznikly české verze databází SpeechDat a SPEECON, které jsou nyní dostupné přes katalog ELRA. Další databáze vznikly v rámci bilaterálních projektů s průmyslovými partnery i evropskými akademickými pracovišti (např. Siemens AG, ETMIC, Harman/Becker, SVOX, Radboud University in Nijmegen, etc.).

Výzkumné aktivity jsou významnou měrou podporovány granty, a to především v rámci projektů GAČR řešených od roku 1996, v jejichž rámci zaznamenal výzkum v oblasti rozpoznávání řeči významný pokrok i v mezinárodním měřítku. Jedná se o projekty: GAČR 102/96/K087 Teorie a aplikace hlasové komunikace v češtině (1996-2001), GAČR 102/02/0124 Hlasové technologie v podpoře informační společnosti (2002-2004), GAČR 102/05/0278 Nové směry ve výzkumu a využití hlasových technologií (2005-2007), GAČR 102/08/0707 Rozpoznávání mluvené řeči v reálném prostředí (2008-2011). Výzkumná skupina participovala také v evropských projektech řady COST, a to především v COST 249: Continuous Speech Recognition over the Telephone a v navazujícím COST 278: Spoken Language Interaction in Telecommunication.

Poslední aktualizace Út dub 15 17:34:43 CEST 2014 Dotazy nebo připomínky posílejte správci. Údržba.