[Back]


Doctor's Theses (authored and supervised):

K. Ambrosch:
"Mapping Stereo Matching Algorithms to Hardware";
Supervisor, Reviewer: A. Steininger, R. Siegwart; Institut für Technische Informatik, 2009.



English abstract:
Stereo vision uses two cameras side by side and extracts the displacement of the objects
caused by the cameras' di erent viewpoints. The displacement, called disparity, is directly
correlated to the distance of the objects. This way a three-dimensional depth map can be
computed.
The core element of a stereo vision system, the stereo matching algorithm, has a high
computational complexity. Fortunately, area-based algorithms proved to be very suitable
for solutions using hardware-based parallel processing, enabling the implementation of
real-time embedded stereo vision systems with high frame rates.
In robotic applications, embedded stereo vision systems are likely to operate in an
environment that is subject to repeated changes. However, in contrast to software-based
implementations, hardware-based solutions cannot easily change their behavior without
deactivating parts of their resources. Therefore, a novel technique to adapt block size,
disparity range and frame rate for hardware implementations of area-based stereo matching
algorithms is proposed. This technique is suitable for FPGAs as well as ASICs, i.e., it comes
along without dynamic recon guration, enabling its implementation on real-time systems
with short deadlines.
Furthermore, novel approaches on how the accuracy of real-time algorithms can be
improved are presented in this work. These approaches are not limited to the extension
of existing algorithms for enhanced noise robustness, but also includes the presentation
of a novel highly accurate real-time stereo matching algorithm that achieves an accuracy
that until now was achievable with non-real time algorithms only, while still being apt to
hardware-based solutions.
This novel stereo matching algorithm is targeted at a high accuracy in non-occluded
regions, i.e. all image areas where a stereo correspondence can be found. The evaluation
of this algorithm using the Middlebury Stereo Ranking, at a maximum deviation of half a
pixel, shows, that by the time this work was performed, it is the only real-time algorithm
that is capable of challenging state of the art non real-time algorithms.

German abstract:
Stereo Vision verwendet zwei Kameras, welche die Umgebung aus verschiedenen Blickwinkeln
betrachten. Die resultierende Verschiebung der Objekte im Bild, welche Disparit at
genannt wird, korreliert mit dem Abstand der Objekte zur Kamera und erm oglicht die
Berechnung eines dreidimensionalen Tiefenbilds mittels Triangulation.
Das Kernelement eines Stereo Vision Systems, der Stereo Matching Algorithmus, hat
eine hohe Komplexit at. Gl ucklicherweise hat sich herausgestellt, dass Fl achenbasierte Algorithmen
besonders geeignet f ur Hardware-Implementierungen sind, wodurch die in Embedded
Stereo Vision Systemen mit einer hohen Bildwiederholrate implementiert werden
k onnen.
In Robotikanwendungen ist es wahrscheinlich, dass Stereo Vision Systeme in wechselnder
Umgebung arbeiten. Im Gegensatz zu Software-Implementierungen, k onnen Hardwarebasierte
ihr Verhalten jedoch nicht leicht andern, ohne Teile ihrer Ressourcen zu deaktivieren.
In dieser Arbeit wird eine neue Methode pr asentiert, mittels derer die Blockgr o e,
die Disparit atsweite und die Bildwiederholrate w ahrend des Betriebs umgestellt werden
kann. Diese Methode ist nicht nur f ur FPGAs sondern auch f ur ASICs geeignet, da sie
ohne dynamische Rekon guration auskommt, wodurch sie optimal f ur Echtzeit Implementierungen
geeignet ist.
Des Weiteren werden Methoden f ur die Verbesserung der Genauigkeit von Echtzeitalgorithmen
pr asentiert. Diese beinhalten nicht nur die Erweiterung bestehender Algorithmen
auf eine verbesserte Robustheit gegen uber Bildrauschen, sondern auch die Vorstellung
eines neuen hochgenauen Echtzeit Algorithmus, welcher optimal f ur die Implementierung
in Hardware basierten System geeignet ist.
Dieser Algorithmus ist auf eine hohe Genauigkeit in nicht abgeschatteten Bildbereichen
fokussiert, also alle Bereiche in denen eine Objektkorrespondenz berechnet werden kann.
Die Evaluierung des Algorithmus mittels des Middlebury Stereo Ranking zeigt, dass die
Resultate in dieser Disziplin eine Genauigkeit erzielen, die bis dato eine reine Dom ane der
nicht echtzeitf ahigen Algorithmen war.

Created from the Publication Database of the Vienna University of Technology.