Bilevel Lernen in der Computer Vision
Bilevel Learning for Computer Vision
Wissenschaftsdisziplinen
Informatik (50%); Mathematik (50%)
Keywords
-
Variational Methods,
Learning,
Computer Vision,
Image Processing,
Bilevel Optimization,
Convex Optimization
Variationsmethoden gehören zu den erfolgreichsten Methoden um inverse Probleme in der Computer Vision und Bildverarbeitung zu lösen. Zu den typische Problemen gehören beispielsweise Aufgaben wie die Bildrekonstruktion, die Bewegungsschätzung sowie die Stereo- und 3D-Rekonstruktion. Bestehende Variationsmodelle in der Computer Vision sind überwiegend hand-designed und basieren daher auf einfachen Prinzipien welche von den intrinsischen Eigenschaften von Bildern abgeleitet wurden. Offensichtlich sind diese Modelle oft zu einfach, um die komplexen physikalischen Eigenschaften der visuellen Welt zu modellieren. Um dieses Problem zu lösen gehen wir einen wichtigen Schritt weiter und betrachten deutlich komplexere Variationsmodelle, welche Regularisierer höherer Ordnung, nicht-lokale Regularisierer sowie Daten-adaptive Regularisierer beinhalten. Weiters schlagen wir vor, die Parameter dieser Modelle mit Hilfe von Optimierungsverfahren zu lernen. Die Grundidee dabei ist, die Parameter der Variationsmodelle so zu lernen, dass die Lösungen der Variationsmodelle eine spezielle Loss-Funktion, die den Fehler zwischen der gewünschten Lösung und der vom Modell vorhergesagten Lösung misst, minimiert. Dieses Problem führt auf natürliche Art und Weise zu einem Bilevel Optimierungsproblem, wobei das innere Optimierungsproblem durch das Variationsmodell und das äußere Optimierungsproblem durch die Loss-Funktion gegeben ist. Es zeigt sich, dass diese Bilevel Optimierungsprobleme sehr viele interessante Eigenschaften haben, welche aber noch viel zu wenig untersucht worden, um die Methode für eine größere Community zugänglich zu machen. Es ist daher das wichtigste Ziel in diesem Projekt, ein einheitlich Framework zu entwickeln, um die Methode auf verschiedenste Variationsmodelle in der Computer Vision anwendbar zu machen. Das einheitliche Framework wird es uns erlauben, bestehende Modelle systematisch zu untersuchen, neue Modelle zu entwickeln und besser ihre Vorteile sowie Einschränkungen zu verstehen. Wir erwarten, dass die Erkenntnisse aus diesem Projekt zu neuen Modellen führt, welche hinsichtlich spezieller Anwendungen und Bilddaten optimiert werden können, und daher zu deutlich besseren Ergebnissen als von bisherigen Modellen führen.
Das Hauptziel des BIVISION-Projekts bestand darin, klassische Variationsansätze in der Bildverarbeitung mit modernen Methoden des maschinellen Lernens zu kombinieren, um aus einer Vielzahl natürlicher Bilder reichhaltigere und genauere Modelle für die Bildverarbeitung zu lernen. Die Kombination von maschinellem Lernen und Variationsmodellen führt naturgemäß zu sogenannten Bilevel-Optimierungsproblemen, welche eine verschachtelte Kombination zweierOptimierungsproblemedarstellen. Dasübergeordnete Optimierungsproblem ist durch das Lernproblem gegeben, während das untergeordnete Optimierungsproblem durch das Variationsmodell definiert wird. Im Laufe des Projekts wurden zahlreiche neuartige numerische Algorithmen und Methoden entwickelt, um immer bessere Modelle aus den Bilddaten zu lernen. Eine der wichtigsten Entwicklungen des Projekts waren die sogenannten Variationsnetzwerke, die eine Mischung aus klassischen Variationsmodellenund modernenneuronalenFaltungsnetzwerkendarstellen. Variationsnetzwerke sind in der Leistung mit modernen tiefe neuronalen Faltungsnetzwerken vergleichbar, ermöglichen jedoch ein besseres Verständnis der Funktionsweise ihrer einzelnen Schichten. Im Rahmen des Projekts wurden die entwickelten Modelle in einer Vielzahl von Anwendungen in den Bereichen Computer Vision, Bildverarbeitung und inverse Probleme eingesetzt. Als Beispiel heben wir die Berechnung von hochwertigen Magnetresonanzbildern aus verrauschten und unterabgetasteten Messdaten hervor. Diese Arbeit wurde in Zusammenarbeit mit der New York University durchgeführt und in einer renommierten Zeitschrift veröffentlicht. Zukünftige Arbeiten werden der theoretischen Analyse von Variationsnetzwerken gewidmet. Ziel ist es, ein theoretisches Rückgrat zu entwickeln, das es erlaubt, Regularitätsaussagen und Rekonstruktionsgarantien zu liefern, wie es in der klassischen Variationsrechnung möglich ist.
- Technische Universität Graz - 100%
- Daniel Cremers, TU München - Deutschland
- Michael Hintermüller, Weierstraß-Institut für Angewandte Analysis und Stochastik - Deutschland
- Antonin Chambolle, Universite de Paris - Dauphine - Frankreich
Research Output
- 4035 Zitationen
- 22 Publikationen
-
2016
Titel Learning Joint Demosaicing and Denoising Based on Sequential Energy Minimization DOI 10.1109/iccphot.2016.7492871 Typ Conference Proceeding Abstract Autor Klatzer T Seiten 1-11 -
2016
Titel Techniques for Gradient-Based Bilevel Optimization with Non-smooth Lower Level Problems DOI 10.1007/s10851-016-0663-7 Typ Journal Article Autor Ochs P Journal Journal of Mathematical Imaging and Vision Seiten 175-194 -
2015
Titel Bilevel Optimization with Nonsmooth Lower Level Problems DOI 10.1007/978-3-319-18461-6_52 Typ Book Chapter Autor Ochs P Verlag Springer Nature Seiten 654-665 -
2015
Titel Vertebrae Segmentation in 3D CT Images Based on a Variational Framework DOI 10.1007/978-3-319-14148-0_20 Typ Book Chapter Autor Hammernik K Verlag Springer Nature Seiten 227-233 -
2015
Titel On Iteratively Reweighted Algorithms for Nonsmooth Nonconvex Optimization in Computer Vision DOI 10.1137/140971518 Typ Journal Article Autor Ochs P Journal SIAM Journal on Imaging Sciences Seiten 331-372 -
2017
Titel Learning a variational network for reconstruction of accelerated MRI data DOI 10.1002/mrm.26977 Typ Journal Article Autor Hammernik K Journal Magnetic Resonance in Medicine Seiten 3055-3071 Link Publikation -
2017
Titel Variational Networks: Connecting Variational Methods and Deep Learning DOI 10.1007/978-3-319-66709-6_23 Typ Book Chapter Autor Kobler E Verlag Springer Nature Seiten 281-293 -
2017
Titel Trainable Regularization for Multi-frame Superresolution DOI 10.1007/978-3-319-66709-6_8 Typ Book Chapter Autor Klatzer T Verlag Springer Nature Seiten 90-100 -
2017
Titel A Deep Learning Architecture for Limited-Angle Computed Tomography Reconstruction DOI 10.1007/978-3-662-54345-0_25 Typ Book Chapter Autor Hammernik K Verlag Springer Nature Seiten 92-97 -
2016
Titel Trainable Nonlinear Reaction Diffusion: A Flexible Framework for Fast and Effective Image Restoration DOI 10.1109/tpami.2016.2596743 Typ Journal Article Autor Chen Y Journal IEEE Transactions on Pattern Analysis and Machine Intelligence Seiten 1256-1272 Link Publikation -
2014
Titel A Deep Variational Model for Image Segmentation DOI 10.1007/978-3-319-11752-2_9 Typ Book Chapter Autor Ranftl R Verlag Springer Nature Seiten 107-118 -
2016
Titel Higher order maximum persistency and comparison theorems DOI 10.1016/j.cviu.2015.05.002 Typ Journal Article Autor Shekhovtsov A Journal Computer Vision and Image Understanding Seiten 54-79 Link Publikation -
2016
Titel U-shaped Networks for Shape from Light Field DOI 10.5244/c.30.37 Typ Conference Proceeding Abstract Autor Heber S Seiten 37.1-37.12 Link Publikation -
2015
Titel Learning Reaction-Diffusion Models for Image Inpainting DOI 10.1007/978-3-319-24947-6_29 Typ Book Chapter Autor Yu W Verlag Springer Nature Seiten 356-367 -
2015
Titel Maximum persistency via iterative relaxed inference with graphical models DOI 10.1109/cvpr.2015.7298650 Typ Conference Proceeding Abstract Autor Shekhovtsov A Seiten 521-529 Link Publikation -
2015
Titel On Learning Optimized Reaction Diffusion Processes for Effective Image Restoration DOI 10.1109/cvpr.2015.7299163 Typ Conference Proceeding Abstract Autor Chen Y Seiten 5261-5269 Link Publikation -
2014
Titel A Higher-Order MRF Based Variational Model for Multiplicative Noise Reduction DOI 10.1109/lsp.2014.2337274 Typ Journal Article Autor Chen Y Journal IEEE Signal Processing Letters Seiten 1370-1374 Link Publikation -
2014
Titel Partial Optimality by Pruning for MAP-inference with General Graphical Models DOI 10.1109/cvpr.2014.153 Typ Conference Proceeding Abstract Autor Swoboda P Seiten 1170-1177 Link Publikation -
2014
Titel iPiano: Inertial Proximal Algorithm for Nonconvex Optimization DOI 10.1137/130942954 Typ Journal Article Autor Ochs P Journal SIAM Journal on Imaging Sciences Seiten 1388-1419 Link Publikation -
2014
Titel Insights Into Analysis Operator Learning: From Patch-Based Sparse Models to Higher Order MRFs DOI 10.1109/tip.2014.2299065 Typ Journal Article Autor Chen Y Journal IEEE Transactions on Image Processing Seiten 1060-1072 Link Publikation -
2018
Titel Assessment of the generalization of learned image reconstruction and the potential for transfer learning DOI 10.1002/mrm.27355 Typ Journal Article Autor Knoll F Journal Magnetic Resonance in Medicine Seiten 116-128 Link Publikation -
2018
Titel Variational Networks for Joint Image Reconstruction and Classification of Tumor Immune Cell Interactions in Melanoma Tissue Sections DOI 10.1007/978-3-662-56537-7_86 Typ Book Chapter Autor Effland A Verlag Springer Nature Seiten 334-340