Computer Vision Research Group

Mitglieder

Gruppenleiter

Dr. rer. nat. Marco Körner

Doktoranden

Tobias KochSandra AignerLukas Liebel
Ksenia BittnerSeyed Majid AzimiBasil Kraft
Marc Rußwurm

Studentische Hilfskräfte

Juan Raul Padron GriffeLuka Sachße

arXiv Feed

  • Rußwurm, Marc; Lefèvre, Sébastien; Courty, Nicolas; Emonet, Rémi; Körner, Marco; Tavenard, Romain: End-to-end Learning for Early Classification of Time Series. arXiv preprint arXiv:1901.10681, 2019 mehr…
  • Liebel, Lukas; Körner, Marco: Auxiliary Tasks in Multi-task Learning. arXiv preprint arXiv:1805.06334, 2018 mehr…
  • Azimi, Seyed Majid; Vig, Eleonora; Bahmanyar, Reza; Körner, Marco; Reinartz, Peter: Towards Multi-class Object Detection in Unconstrained Remote Sensing Imagery. arXiv preprint arXiv:1807.02700, 2018 mehr… Volltext ( DOI )

Projekte

Monokulare Tiefenschätzung

Die Erstellung von Tiefenkarten ist essentiell für zahlreiche Anwendungen, wie z.B. autonomes Fahren oder Augmented Reality. Typischerweise werden diese aus Stereobild-Paaren oder mit Hilfe von aktiven Sensoren (wie z.B. LiDAR oder RGB-D Kameras) generiert. Angelehnt an die monokulare Tiefenwahrnehmung des Menschen, widmet sich dieses Projekt hingegen der Schätzung von Tiefenkarten aus Einzelbildern mittels künstlicher neuronaler Netze.

MAV 4 BIM

Dieses Projekt beschäftigt sich mit der Erstellung von vollständigen und hochauflösenden 3D Gebäudemodellen aus Bildsequenzen von Micro Aerial Vehicles (MAVs). Neben der Rekonstruktion und Georeferenzierung von 3D Gebäudeaußenmodellen, soll ebenfalls das Gebäudeinnere aus unabhängigen Innenflügen modelliert werden. Eine automatische Registrierung von Gebäudeinnen- und außenmodellen ermöglicht die Erstellung von LOD-4 Gebäudemodellen.

CNN-basierte großräumige Landnutzungs- und Landbedeckungsklassifizierung

In diesem Projekt sollen Methoden zur Landnutzungs- und Landbedeckungsklassifizierung mit Hilfe von Convolutional Neural Networks entwickelt werden. Trainingsdaten werden quasi-automatisch aus frei verfügbaren Geodaten (OpenStreetMap) und multispektralen Sentinel-2 Bildern gewonnen.

Prädiktion von Bildfolgen aus FAS-Videosequenzen durch implizite Modellierung von Aktivitätsmustern

Die Sicherheit von autonomen Fahrsystemen ist stark abhängig von einer vorausschauenden Fahrweise der autonomen Fahrzeuge. Ziel dieses Projekts ist es, die Fähigkeit des menschlichen Gehirns zukünftige Ereignisse zu prädizieren, nachzubilden. Mit Hilfe aktueller Methoden der Computer Vision und des maschinellen Lernens werden auf Grundlage von beobachteten Bildsequenzen zukünftige Bildfolgen eines Videos generiert, aus denen Vorhersagen zum Verkehrsgeschehen abgeleitet werden. Die vom System gelernten Merkmale werden zudem genutzt um Verkehrsumgebungen und Aktionsmuster von Verkehrsteilnehmern zu modellieren und analysieren.

Modellierung von Verkehrsinfrastrukturen

Die Modellierung von Verkehrsinfrastrukturen wird immer wichtiger, insbesondere seit autonome Fahrsysteme Teil der nahen Zukunft zu sein scheinen. Im Zuge dieses Projekts werden Algorithmen zur Prozessierung von Kameraaufnahmen aus Fahrzeugen entwickelt um alle verkehrsrelevanten Objekte, wie z.B. Verkehrsteilnehmer und Infrastrukturelemente, zu erfassen. Ergänzend zu den Informationen aus Bodenaufnahmen werden Luftbilder genutzt um Gruppenverhalten zu analysieren und das Verkehrsgeschehen vorherzusagen.

Publikationen