Regularisierungstechniken im Lernen mit Big Data
Regularization Techniques in Learning with Big Data
Wissenschaftsdisziplinen
Mathematik (100%)
Keywords
-
Regularized Learning Algorithm,
Big Data,
Nyström subsampling,
Distributed Learning,
Regularized Aggregation,
Semi-Supervised Learning
Methoden der Regularisierungstheorie wurden für die Probleme des Lernens am Anfang der 90er Jahre in den grundlegenden Arbeiten von Poggio und Girosi eingeführt. Aufgrund der Natur von den Lernaufgaben müssen die Regularisierungstechniken, wie z. B. Lawrentjew-Regularisierung, die ursprünglich für die kontinuierlichen schlecht gestellten Probleme entwickelt wurden, auf diskrete Daten angewendet werden. Aber weil die Lernprobleme von Natur aus schlecht gestellt sind, und wegen des sogenannten Überanpassungsrisikos, macht die diskrete Form der Daten die Anwendung der Regularisierungsverfahren für die Analyse und Interpretation nicht einfacher. Daher gibt es eine umfangreiche Literatur über das regularisierungs-basiertes Lernen, und die Forschung in diesem Bereich ist immer noch sehr aktiv. Zur gleichen Zeit wird das Lernen mit Big Data ein aktuelles Forschungsgebiet wegen seiner großen Potenzials und Bedeutung in vielen wissenschaftlichen und industriellen Rahmen. Jedoch kann eine direkte Anwendung der bekannten regularisierten Lernalgorithmen für das Lernen mit Big Data praktisch nicht realisierbar werden. In diesem Projekt werden wir das Problem der praktischen Realisierbarkeit mit Hilfe von neuen Ideen in der Regularisierungstheorie behandeln.
Eine wichtige Klasse von maschinellen Lernalgorithmen bilden die sogenannten Kernel-Methoden, die in den Reproduzierender-Kernel-Hilbert-Räumen arbeiten. In diesen Methoden ist der Prozess der Bestimmung von Ausgabewerten einer Funktion für jede Eingabe wohldefiniert. Die Standardimplementierung dieser Algorithmen ist jedoch beim Umgang mit großen Trainingsdaten nicht praktikabel, da sie die Rechenkapazität herkömmlicher Computer übersteigt. Eine der Errungenschaften des abgeschlossenen Projekts ist die Entwicklung einer vollständig datengesteuerten Strategie zur gleichzeitigen Bestimmung der Hyperparameter der Kernel-Lernalgorithmen, die ihre praktikable Implementierung ohne Verlust an Genauigkeitsordnung im Vergleich zur idealen Nutzung der verfügbaren großen Trainingsdatensätze ermöglicht. Um das Testen der theoretischen Ergebnisse gegen Datensätze aus der realen Welt umzusetzen, wurde das Projekt an die Medizinische Universität Innsbruck übertragen, wo auch der Einsatz der maschinellen Lernalgorithmen in der neuroradiologischen Datenverarbeitung vorangetrieben wurde. Die Hauptergebnisse des Projekts wurden in den führenden wissenschaftlichen Zeitschriften in den Bereichen Computer- und Angewandte Mathematik und Radiologie veröffentlicht. Das Projekt wurde in enger Zusammenarbeit mit anderen Projektteams durchgeführt, die von verschiedenen Förderstellen unterstützt wurden. Solche Synergie von Forschungsaktivitäten kann als Beispiel für Bestrebungen angesehen werden, den Wert der in die Forschung investierten öffentlichen Gelder zu steigern.
- Ding-Xuan Zhou, University of Sydney - Australien
- Lorenzo Rosasco, Massachusetts Institute of Technology - Vereinigte Staaten von Amerika
- Mikhail Belkin, University of California San Diego - Vereinigte Staaten von Amerika
Research Output
- 170 Zitationen
- 21 Publikationen
- 2 Wissenschaftliche Auszeichnungen
-
2019
Titel Adaptive multi-parameter regularization approach to construct the distribution function of relaxation times DOI 10.1007/s13137-019-0138-2 Typ Journal Article Autor Žic M Journal GEM - International Journal on Geomathematics Seiten 2 Link Publikation -
2024
Titel Cervical artery tortuosity—a reliable semi-automated magnetic resonance-based method DOI 10.21037/qims-23-1057 Typ Journal Article Autor Mayer-Suess L Journal Quantitative Imaging in Medicine and Surgery Seiten 1383391-1381391 Link Publikation -
2024
Titel Galaxy and Mass Assembly: Automatic morphological classification of galaxies using statistical learning DOI 10.25916/sut.26247044 Typ Other Autor Pereverzyev S Link Publikation -
2024
Titel Galaxy and Mass Assembly: Automatic morphological classification of galaxies using statistical learning DOI 10.25916/sut.26247044.v1 Typ Other Autor Pereverzyev S Link Publikation -
2019
Titel Analysis of regularized Nyström subsampling for regression functions of low smoothness DOI 10.1142/s0219530519500039 Typ Journal Article Autor Lu S Journal Analysis and Applications Seiten 931-946 Link Publikation -
2019
Titel Regularized Nyström subsampling in regression and ranking problems under general smoothness assumptions DOI 10.1142/s021953051850029x Typ Journal Article Autor Myleiko G Journal Analysis and Applications Seiten 453-475 -
2018
Titel Joint Inversion of Multiple Observations DOI 10.1007/978-3-319-57181-2_14 Typ Book Chapter Autor Gerhards C Verlag Springer Nature Seiten 855-882 -
2018
Titel The quasi-optimality criterion in the linear functional strategy DOI 10.1088/1361-6420/aabe4f Typ Journal Article Autor Kindermann S Journal Inverse Problems Seiten 075001 Link Publikation -
2018
Titel Operator Learning Approach for the Limited View Problem in Photoacoustic Tomography DOI 10.1515/cmam-2018-0008 Typ Journal Article Autor Dreier F Journal Computational Methods in Applied Mathematics Seiten 749-764 Link Publikation -
2017
Titel Galaxy And Mass Assembly: Automatic Morphological Classification of Galaxies Using Statistical Learning DOI 10.48550/arxiv.1711.06125 Typ Preprint Autor Sreejith S -
2017
Titel Operator learning approach for the limited view problem in photoacoustic tomography DOI 10.48550/arxiv.1705.02698 Typ Preprint Autor Dreier F -
2020
Titel Stenosis Detection in Internal Carotid and Vertebral Arteries With the Use of Diameters Estimated from MRI Data DOI 10.20535/ibb.2020.4.3.207624 Typ Journal Article Autor Nesteruk I Journal Innovative Biosystems and Bioengineering Seiten 131-142 Link Publikation -
2020
Titel Novel decision algorithm to discriminate parkinsonism with combined blood and imaging biomarkers DOI 10.1016/j.parkreldis.2020.05.033 Typ Journal Article Autor Mangesius S Journal Parkinsonism & Related Disorders Seiten 57-63 Link Publikation -
2024
Titel Peripheral inflammatory response in people after acute ischaemic stroke and isolated spontaneous cervical artery dissection DOI 10.1038/s41598-024-62557-3 Typ Journal Article Autor Bauer A Journal Scientific Reports Seiten 12063 Link Publikation -
2024
Titel Cervical Artery Tortuosity Is Associated With Dissection Occurrence and Late Recurrence: A Nested Case-Control Study DOI 10.1161/strokeaha.124.049046 Typ Journal Article Autor Mayer-Suess L Journal Stroke Seiten 413-419 -
2018
Titel Analysis of regularized Nyström subsampling for regression functions of low smoothness DOI 10.48550/arxiv.1806.00826 Typ Preprint Autor Lu S -
2020
Titel Feed-forward neural networks using cerebral MR spectroscopy and DTI might predict neurodevelopmental outcome in preterm neonates DOI 10.1007/s00330-020-07053-8 Typ Journal Article Autor Janjic T Journal European Radiology Seiten 6441-6451 Link Publikation -
2022
Titel On a regularization of unsupervised domain adaptation in RKHS DOI 10.1016/j.acha.2021.12.002 Typ Journal Article Autor Gizewski E Journal Applied and Computational Harmonic Analysis Seiten 201-227 -
2017
Titel Multi-Penalty Regularization for Detecting Relevant Variables DOI 10.1007/978-3-319-55556-0_15 Typ Book Chapter Autor Hlavácková-Schindler K Verlag Springer Nature Seiten 889-916 -
2017
Titel Galaxy And Mass Assembly: automatic morphological classification of galaxies using statistical learning DOI 10.1093/mnras/stx2976 Typ Journal Article Autor Sreejith S Journal Monthly Notices of the Royal Astronomical Society Seiten 5232-5258 Link Publikation -
2017
Titel The quasi-optimality criterion in the linear functional strategy DOI 10.48550/arxiv.1709.09444 Typ Preprint Autor Kindermann S
-
2020
Titel Associate Editor of the journal Mathematical Foundations of Computing Typ Appointed as the editor/advisor to a journal or book series Bekanntheitsgrad Continental/International -
2018
Titel Best Poster Award Typ Poster/abstract prize Bekanntheitsgrad Continental/International