AbstractsComputer Science

Dynamické rozpoznávání scény pro navigaci mobilního robotu

by Ondřej Mikšík




Institution: Brno University of Technology
Department:
Year: 0
Keywords: mobilní robot; vizuální navigace; úběžník cesty; směs Gaussovských modelů; Matching Pursuit; porozumění scéně; prostorově-časová konzistentnost; mobile robot; visual navigation; vanishing point; Gaussian Mixture Model; Matching Pursuit; scene understanding; spatio-temporal consistency
Record ID: 1097621
Full text PDF: http://hdl.handle.net/11012/18207


Abstract

Diplomová práce se zabývá porozuměním dynamických scén pro navigaci mobilních robotů. V první části předkládáme nový přístup k "sebe-učícím" modelům - fůzi odhadu úběžníku cesty založeného na frekvenčním zpracování a pravděpodobnostních modelech využívající barvu pro segmentaci. Detekce úběžníku cesty je založena na odhadu dominantních orientací texturního toku, získáného pomocí banky Gaborových vlnek, a hlasování. Úběžník cesty poté definuje trénovací oblast, která se využívá k samostatnému učení barevných modelů. Nakonec, oblasti tvořící cestu jsou vybrány pomocí měření Mahalanobisovi vzdálenosti. Pár pravidel řeší situace, jako jsou mohutné stíny, přepaly a rychlost adaptivity. Kromě toho celý odhad úběžníku cesty je přepracován - vlnky jsou nahrazeny aproximacemi pomocí binárních blokových funkcí, což umožňuje efektivní filtraci pomocí integrálních obrazů. Nejužší hrdlo celého algoritmu bylo samotné hlasování, proto překládáme schéma, které nejdříve provede hrubý odhad úběžníku a následně jej zpřesní, čímž dosáhneme výrazně vyšší rychlosti (až 40x), zatímco přesnost se zhorší pouze o 3-5%. V druhé části práce předkládáme vyhlazovací filtr pro prostorovo-časovou konzistentnost predikcí, která je důležitá pro vyspělé systémy. Klíčovou částí filtru je nová metrika měřící podobnost mezi třídami, která rozlišuje mnohem lépe než standardní Euclidovská vzdálenost. Tato metrika může být použita k nejrůznějším úlohám v počítačovém vidění. Vyhlazovací filtr nejdříve odhadne optický tok, aby definoval lokální okolí. Toto okolí je použito k rekurzivní filtraci založené na podobnostní metrice. Celková přesnost předkládané metody měřená na pixelech, které nemají shodné predikce mezi původními daty a vyfiltrovanými, je téměř o 18% vyšší než u původních predikcí. Ačkoliv využíváme SHIM jako zdroj původních predikcí, algoritmus může být kombinován s kterýmkoliv jiným systémem (MRF, CRF,...), který poskytne predikce ve formě pravěpodobností. Předkládaný filtr představuje první krok na cestě k úplnému usuzování.; The thesis deals with dynamic scene understanding for mobile robot navigation. In the first part, we propose a novel approach to self-supervised learning - a fusion of frequency based vanishing point estimation and probabilistically based color segmentation. Detection of a vanishing point is based on the estimation of a texture flow produced by a bank of Gabor wavelets and a voting function. Next, the vanishing point defines the training area which is used for self-supervised learning of color models. Finally, road patches are selected by measuring roadness score. A few rules deal with dark cast shadows, overexposed hightlights and adaptivity speed. In addition to that, the whole vanishing point estimation is refined - Gabor filters are approximated by Haar-like box functions, which enables efficient filtering via integral image trick. The tightest bottleneck, a voting scheme, is modified to coarse-to-fine, which provides a significant speed-up (more than 40x), while we loose only 3-5% in precision. The second part…