Uživatel:Melnipet

Z HPM wiki
Přejít na: navigace, hledání

Téma semestrální práce: Systémy počítačového vidění

(Článek je zejména textovou (doplňkovou) verzí pro prezentaci. Práce obecně informuje o existenci systémů počítačového vidění)


Obsah

Počítačové vidění

Ilustrační příklad počítačového vidění

Jedná se o relativně mladé rapidně rostoucí odvětví z oblasti výpočetní techniky a snímání digitálního obrazu. Počítačové vidění je souhrnný název pro získávání, zpracování, analyzování a rozpoznávání obrazových dat. Obecně se dá říci, že se jedná o transformaci dat digitálního obrazu na jinou formu dat, která odpovídá požadované aplikaci. Může se jednat například o parametry popisující určitý objekt v obraze, či zda se objekt vůbec v obraze vyskytuje.

Systémy počítačového vidění

Jednoduchý systém počítačového vidění
Systém pro utváření statistik hráčů ve fotbale

Jsou propojené soubory zařízení pro vykonávání určité aplikace počítačového vidění. V jednoduchém případě se může například jednat o propojení jednodeskového počítače s webkamerou. Takový systém může například fungovat jako bezpečnostní systém detekce pohybu. Systémy ale mohou být mohutné a skládat se až z desítek kamer připojených do jednoho robustního systému. Například na mistrovství světa ve fotbale se používá systém, který sleduje fotbalové hřiště a téměř automaticky vytváří velmi komplexní a rozsáhlé statistiky jednotlivých hráčů. Popřípadě podobný systém se používá v tenise pro kontrolu dopadu míčku.


Aplikace počítačového vidění

Detekce obličeje
Kontrola produktů při sériové výrobě

Aplikací počítačového vidění známějších i míň známějších existuje ohromné množství a v skoro v každém odvětví lidských činností se pro něj dá najít uplatnění.

Mezi známějšími aplikace počítačového vidění například patří:

• Detekce pohybu

• Detekce a rozpoznání obličeje

• Herní konzole se snímáním pohybu (Kinect)

• Motion tracking, motion capturing, digitální stabilizace

• Oční pohyby

• Jestřábí oko (tenis)

• Kontrola produktů při sériové výrobě


Rozdíl mezi lidským vizuálním systémem a systémem počítačového vidění

Fotografie je reprezentována maticí čísel

Pro pochopení komplikovanosti počítačového vidění. Je vhodné si uvědomit velké rozdíly mezi lidským vizuálním systémem a systémem počítačového vidění. Lidský vizuální systém je neuvěřitelně komplexní a je naším nejdůležitějším smyslem. Jednou z jeho nejpozoruhodnějších funkcí je, že nám umožnuje rozpoznávat objekty za různých podmínek, nebo dokonce rozpoznávat objekty, které jsme nikdy neviděli a to na základě paměti, nebo zkušenosti. Naproti tomu jsou systémy počítačového vidění velmi primitivní. Kamery a fotoaparáty fungují sice podobným způsobem jako lidské oko, ale zpracování se liší. V případě počítačového vidění dostane PC k dispozici pouze matici čísel, které odpovídají intenzitám jednotlivých pixelů. Úkolem počítačového vidění je získat nějaký požadovaný vjem z těchto matic.

Procesy počítačového vidění

Pespektivní korekce
Detekce pohybu a estimace pozadí

Funkcí počítačového vidění je získat z matice čísel (obrazových dat) požadovaný vjem. Obrazová data jsou obvykle předána počítači, ve kterém je možné s nimi provádět různé operace. Pro významné programovací jazyky existují různé knihovny funkcí a procedur počítačového vidění, například knihovna OpenCV.

Některé vybrané procesy počítačového vidění:

• Barevné a geometrické transformace

• Vyhlazování

• Práhování (threshold) a jiné druhy filtrace

• Hranová detekce

• Separace pozadí a detekce pohybu


V aplikacích se většinou postupuje cestou postupné filtrace a zjednodušování obrazu až na požadovanou úroveň, podle dané aplikace.
Požadavky na HW systému počítačového vidění

Požadavky na hardware se velmi liší podle aplikace. Obecně lze říci, že se systémy počítačového vidění skládají z dvou komponent: získávání obrazu a jeho interpretace. Tyto dvě komponenty jsou mezi sebou svázané a měli by být v určité harmonii.

Získávání obrazu

Nástrojem pro získávání obrazu je ve většině případů aplikací kamera, fotoaparát, popř. skener. Tato komponenta systému není obvykle problematická. V současnosti jsou k dispozici zařízení s kvalitními CCD nebo CMOS senzory s rozlišením několika milionu bodů a schopností snímat desítky, stovky nebo i tisíce snímku za sekundu. Rovněž existují termovizní infračervené kamery nebo kamery mikroskopické, apod. Rozlišení, snímková frekvence a šumové vlastnosti jsou většinou hlavní parametry související se schopností rozpoznávat, či analyzovat cokoliv v obraze. Vysoké rozlišení a vysoká snímková frekvence znamenají zvýšení detailů sledované scény, ale také úměrně souvisí s objemem dat, které je nutno zpracovávat.

Požadavky na rozhraní nástrojů pro získávání obrazu jsou v podstatě neomezené. Důležité je pouze dostat obraz do PC, což je nejčastěji realizováno různými frame grabber kartami do PCI. Pro aplikace strojového vidění se na straně kamer nejčastěji používají rozhraní: GigE vision (over Ethernet), USB 2.0 a USB 3.0, USB 3.0 Vision, FireWire, CameraLink, CoaXPress.

Interpretace obrazu

Je problematičtější části systémů a má dva hlavní aspekty: rychlost a kvalita interpretace. Kamery produkují velké množství dat, a přestože výpočetní výkon a paměťové schopnosti počítačů v posledních desítkách let neuvěřitelně narostly, pořád může být problém například zpracovávat video ve vysokém rozlišení v reálném čase.

Rychlost interpretace závisí především na množství zpracovávaných dat, složitosti algoritmu a výpočetním výkonu. Rychlost je sledovaným parametrem hlavně u systému pracujících v reálném čase.

Kvalita interpretovaných dat závisí hlavně na schopnostech algoritmu a vhodném způsobu získávání obrazových dat a jejich kvalitě.

Harmonie komponent

Harmonií komponent se myslí například, aby nenastala situace, kdy se snímací zařízení snaží tlačit 4k/100fps záběr velké silnice do zařízení typu jednodeskového PC a to má v reálném čase například určovat počty automobilů a jejich rychlosti. V tomto případě je interpretační část systému značně poddimenzovaná a systém nebude s největší pravděpodobností správně fungovat.

Ani naddimenzování interpretační části není v pořádku. Zejména z hlediska úspor energie a financí. Například je zbytečné vyhrazovat stolní PC pro 24 hodinové detekování pohybu na dvorku VGA webkamerou. Na takový úkon postačí zařízení s nižším výpočetním výkonem.


Příklady systémů počítačového vidění

Monitoring dopravy

Kamery na sloupu veřejného osvětlení
Schéma měření úsekové rychlosti za pomoci kamer

Významnou část existujících systému tvoří systémy pro monitorování dopravy, měření rychlosti a identifikaci automobilů podle jejich poznávací značky. Tyto systémy povětšinou slouží polici, či jiným orgánům pro vymáhání práva při porušování dopravních předpisů, popřípadě třeba mohou i pomoci najít odcizené vozidlo. Při měření rychlosti projíždějících automobilů jsou tyto systémy na rozdíl od radiových nedetekovatelné. U nás v ČR se pro popsané záležitosti využívá systému nazývaného Unicam od společnosti CAMEA s.r.o..

Systém od společnosti CAMEA s. r. o. využívá několika kamer umístěných na určitém úseku silnice. Je detekován příjezd automobilu do určité oblasti a jeho výjezd z oblasti. Tímto způsobem se měří průměrná rychlost automobilu v úseku. Spolu s detekcí automobilu je detekována a rozpoznána poznávací značka, která může být porovnána s databází hledaných automobilů. Tyto systémy pracují v reálném čase a jsou k nalezení především na sloupech veřejného osvětlení podél silničních komunikací, z nichž jsou napájeny. Z oblasti počítačového vidění využívají hlavně algoritmy detekce pohybu, filtrace obrazu, geometrické transformace a rozpoznávání charakteristických rysů.


Jestřábí oko

Systém jestřábího oka v tenise
Systém jestřábího oka ve fotbale

Další z významných a zajímavých systémů je takzvané jestřábí oko, které se používá jako prostředek pro sledování míčů v některých sportech, zejména v tenise. V tenise má systém má na starost precizně sledovat a zaznamenávat pohyb tenisového míčku po hrací ploše. Na požádání systém například určuje, zda míček spadl do hřiště nebo do outu. Systém je složen z několika vysokorychlostních kamer s vysokým rozlišením. Ty jsou umístěny po obvodu tenisového kurtu, tak aby každá snímala kurt z jiného úhlu, celý systém je geometricky kalibrován. Z každé kamery je pro každý okamžik extrahována informace o poloze míčku. Díky umístění kamer je možné za pomoci triangulace vypočítat souřadnice polohy míčku v prostoru. Ve fotbale se dá použít v podstatě stejná technologie. Při zaznamenání gólu je informace odeslána rozhodčímu na hodinky do půl sekundy.

Závěr

Systémy počítačového vidění jsou nedílnou součástí dnešního moderního světa, jejich použití sahá přes všechny obory lidské činnosti. Kvalita, rychlost a robustnost interpretace obrazových dat se neustále zvyšuje s lepšími a lepšími algoritmy. Díky neustálému vývoji v oblasti výpočetní techniky se stále otevírají nová vrátka pro další aplikace počítačového vidění. Díky systémům počítačového vidění (nejen) vznikají autonomní automobily a například v Kalifornii může ověřené auto získat vlastní průkaz, opravňující ho k provozu na normálních komunikacích. Je zřejmé, že počítačové vidění má ještě hodně směrů k vývoji a rozhodně bude hrát roli v technologiích budoucnosti.


Zdroje informací

[1] BRADSKI Gray & KAEHLER Adrian, Learning OpenCV, O‘REILLY, 2008

[2] BEHNKE Sven, Hierarchial Neural Networks for Image Interpretation, Springer, 2003

[3] Dokumentace OpenCV, http://docs.opencv.org/

[4] http://en.wikipedia.org/wiki/Computer_vision

[5] http://www.deltatre.com/onstage-solutions/matrics/

[6] http://www.camea.cz/cz/

Osobní nástroje
Jmenné prostory
Varianty
Akce
Navigace
Nástroje