GPU zrýchlené rozpoznávanie objektov s neurónovými konvolučnými sieťami - PDF na stiahnutie zadarmo

Rheinische Friedrich-Wilhelms-Universität Bonn Institute for Computer Science VI Dominik Scherer GPU-akcelerované rozpoznávanie objektov so sieťami neurálnej konvolúcie 8. júna 2009 Diplomová práca Prvý recenzent: Prof. Dr. Sven Behnke Druhý recenzent: Prof. Dr. Prístup Joachima K.

sieťami

2.4. Paralelný hardvér Obrázok 2.16: Architektúra SIMT: Niekoľko multiprocesorov so zdieľanou pamäťou integrovanou do čipu (od [Nvi08c], upravené) Zdieľaná pamäť 16 kB, ku ktorej majú prístup všetky vlákna bloku, je takmer rovnako rýchla, ale o niečo flexibilnejšia. Najväčšia kapacita grafickej karty je 1 GB v pamäti zariadenia, ktorú môžu využívať všetky procesory. Pretože však táto pamäť má pomerne vysokú latenciu, má každý multiprocesor konštantnú pamäť 64 kB, ktorú je možné iba čítať. Ďalšou špeciálnou vlastnosťou je pamäť textúr, ktorá je optimalizovaná pre dvojrozmerný prístup a ktorej adresovanie je riadené špeciálnou jednotkou textúr. Hostiteľ má prístup iba do pamäte zariadenia, všetky ostatné oblasti pamäte sú k dispozícii iba na GPU. Rýchlosť výpočtu pre mnoho algoritmov je obmedzená dostupnou pamäťou. Počet blokov, ktoré dokáže súčasne spracovať viacprocesor, závisí predovšetkým od dvoch faktorov: Na jednej strane od toho, koľko registrov vlákno vyžaduje, a na druhej strane od veľkosti zdieľanej pamäte, ktorú blok 33

4.4. Vstup a výstup (a) farebný obrázok (b) filter s vertikálnymi okrajmi (c) filter s horizontálnymi okrajmi (d) jasová zložka Y (e) chrominančná zložka U (f) chrominančná zložka V Obrázok 4.7: Rôzne predspracovanie viacfarebného vstupného obrazu (a) Zarovnanie na stred (b) Náhodné Umiestnenie (c) Vertikálna súradnica polohy v kódovaní šedej stupnice (d) Pokračovanie okrajových pixelov (e) Vyblednutie z okraja (f) Vyblednutie z pokračujúcich okrajových pixelov Obrázok 4.8: Alternatívne možnosti riešenia obrázka, ktorý je pre vstupnú úroveň príliš malý. 55