Wie Computer Videos erkennen

22.01.2015
Mit dem Prinzip des optischen Flusses  kann das Gesicht eines Schauspielers mit realistischer Mimik und Gestik rekonstruiert werden (Bild: Universität Stuttgart)
Mit dem Prinzip des optischen Flusses kann das Gesicht eines Schauspielers mit realistischer Mimik und Gestik rekonstruiert werden (Bild: Universität Stuttgart)
Fahrerassistenzsysteme, die Hindernisse im Straßenverkehr erkennen, visuelle Effekte in Filmen, computeranimierte Charaktere und Bildverarbeitung in der Medizin, um das Wachstum eines Tumors zu beobachten: Hinter all diesen Technologien steckt ein Verfahren, an dessen stetiger Verbesserung die Informationsforschung seit Jahren arbeitet, der sogenannte optische Fluss. Ein Spezialist auf diesem Gebiet ist Professor Andrés Bruhn vom Institut für Visualisierung und Interaktive Systeme der Universität Stuttgart. Auf der European Conference on Computer Vision in Zürich wurde er jüngst gemeinsam mit Fachkollegen für eine vor zehn Jahren entwickelte Methode mit einem der renommiertesten Preise auf dem Gebiet des maschinellen Sehens ausgezeichnet, dem Jan Koenderink Prize for Fundamental Contributions in Computer Vision.
Mit dem Prinzip des optischen Flusses können Computer Bewegungen in einem Video erkennen. Dahinter verbirgt sich ein Algorithmus, der jeden Bildpunkt eines einzelnen Videobildes betrachtet und dessen Verschiebung in Bezug zu einem Referenzbild errechnet. Zahlreiche Technologien lassen sich auf dieser Basis realisieren. Beispielsweise können in einem Film real nicht existierende Zwischenbilder erstellt werden, um Zeitlupeneffekte ohne Qualitätsverlust zu erzeugen oder aus Videoaufnahmen computergenerierte Filmsequenzen zu erstellen. Das Gesicht eines Schauspielers kann auf diese Weise mit realistischer Mimik und Gestik rekonstruiert werden und dann durch einen virtuellen Charakter ersetzt werden.
Auch Anwendungen im Fahrzeugbau basieren auf der Methode. So gibt es Fahrerassistenzsysteme, die auf Basis von Kamerabildern Abstände zu Hindernissen erkennen, sich bewegende Objekte identifizieren, Kollisionen vorhersagen oder andere Aussagen über die Verkehrssituation treffen. Ein weiterer Wirtschaftszweig, in dem der optische Fluss zum Einsatz kommt, ist die medizinische Bildverarbeitung. Dort werden beispielsweise verschiedene Aufnahmen überlagert, um das Wachstum eines Tumors konkreter untersuchen zu können.
„Die verfügbaren Methoden des optischen Flusses haben sich in vielen Anwendungen bewährt“, sagt Andrés Bruhn, „aber dennoch unterliegen sie einer Vielzahl von Beschränkungen. Diese weiter zu minimieren und weitere Anwendungsfelder zu erschließen ist das Ziel unserer Arbeit.“ Insbesondere beschäftigt sich sein Forscherteam mit der Verwertung von Aufnahmen mit schlechter Beleuchtung oder raschen Bewegungs- oder Farbänderungen.