Schrumpfen und Regularisieren von Finiten Mischmodellen
Shrinking and Regularizing Finite Mixture Models
Wissenschaftsdisziplinen
Informatik (5%); Mathematik (85%); Wirtschaftswissenschaften (10%)
Keywords
-
Finite mixture model,
Unobserved heterogeneity,
Bayesian estimation,
Conjugate prior,
Regularization,
Shrinkage
Es wird oft vermutet, dass Gruppen von Beobachtungen mit unterschiedlichen Charakteristika in Daten vorhanden sind. Jedoch sind die Gruppenzugehörigkeiten entweder nicht verfügbar oder nicht beobachtbar. In dieser Situation muss eine statistische Methode in der Datenanalyse verwendet werden, die explizit erlaubt, das Auftreten von latenten Gruppen zu berücksichtigen, und die versucht, sowohl die Gruppengrößen als auch Gruppencharakteristika zu bestimmen. Das Standardwerkzeug für dieses Problem bei der statistischen Analyse basierend auf einem statistischen Modell ist das finite Mischmodell. Finite Mischmodelle werden seit mehr als 100 Jahren verwendet und stellen ein flexibles und generell anwendbares statistisches Werkzeug dar, für das bereits viele Erweiterungen und Varianten vorgeschlagen wurden. Jedoch sind manche Probleme immer noch ungelöst, wie die korrekte Selektion der Variablen für die Analyse, die die Gruppenstruktur festlegen, und die Auswahl eines geeigneten Modells, das eine Überanpassung an die Heterogenität vermeidet, um eine leichte Interpretierbarkeit und ein konzises Schätzen der Parameter zu ermöglichen. In dem vorliegenden Forschungsprojekt werden wir versuchen, die Anwendung von finiten Mischmodellen zu verbessern, indem wir Werkzeuge basierend auf Schrumpfen (Shrinkage) und Regularisierung entwickeln, die die Auswahl eines geeigneten Modells ermöglichen, wobei zwischen relevanten und irrelevanten Variablen automatisch unterschieden wird, und die Parameter auf eine Art und Weise festgelegt werden, sodass Überanpassung vermieden wird. Die theoretischen Resultate werden durch Anwendungen und eine Implementierung in Software komplementiert, die in Form von Erweiterungspaketen für die quelloffene Software R, einer Umgebung für statistisches Rechnen und Graphik (http://www.R-project.org), erfolgen wird. The Verfügbarkeit von verbesserten statistischen Methoden in Kombination mit Softwareimplementierungen erlaubt die bessere Analyse und ein erweitertes Verständnis für die Daten in empirischen, quantitativen Analysen. Aufgrund der weiten Anwendungsmöglichkeiten von finiten Mischmodellen, z.B. in der Astronomie, Biologie, Ökonomie, Marketing, Medizin und Psychologie, kann angenommen werden, dass die Resultate dieses Forschungsprojekts auch eine Auswirkung auf andere Forschungsbereiche haben, indem ein verbesserter Einblick in die latente Gruppenstruktur, die in den Daten vorhanden ist, gewonnen wird.
Clusteranalyse ist eine statistische Methode, die erlaubt, Struktur in Daten mithilfe des Gruppierens von Beobachtungen zu erkennen.Clusteranalyse wird in vielen verschiedenen Bereichen eingesetzt, in denen Daten analysiert werden. Der modellbasierte Ansatz zur Clusteranalyse bettet das Cluster-Problem in die Methodik der statistischen Inferenz ein und verwendet dabei Mischmodelle als zugrundeliegendes datengenerierendes Modell. Der modellbasierte Ansatz ist reizvoll, da statistische Inferenzverfahren zum Beantworten von relevanten Fragestellungen bei der Clusteranalyse herangezogen werden können. Weiters sind Erweiterungen direkt verfügbar, indem man andere statistische Modelle für die Komponenten des Mischmodells verwendet. Das Verfolgen eines Bayesianischen Ansatzes erleichtert das Einbeziehen von Vorinformation in die Modellierung, wie das Wissen im Bezug auf die Clusterformen oder deren Anzahl. Dadurch wird die Ambiguität des Cluster-Problems reduziert, und man findet leichter geeignete Clusterlösungen. In diesem Projekt entwickelten wir die Bayesianische Modellierung von Mischmodellen mit Fokus auf die Anwendung beim modellbasierten Clustern weiter. Wir verfolgten einen ganzheitlichen Ansatz, wobei wir generelle Aspekte wie die Spezifikation der A-priori-Verteilungen sowie des Modells selbst als auch deren Schätzung und allgemeine Überlegungen im Bezug auf die erfolgreiche Anwendung abdeckten. Wir versuchten eine Brücke zwischen endlichen und unendlichen Mischmodellen zu schlagen, indem wir Gemeinsamkeiten, aber auch wesentliche Unterschiede zwischen den beiden Modellklassen herausarbeiteten. Wir untersuchten die Annahme einer A-priori-Verteilung für die Zahl der Komponenten, um die Modellunsicherheit zu berücksichtigen, und erhielten damit eine vollständige Bayesianische Modellspezifikation, die im generalisierten Mischung-endlicher-Mischungen (MFM) Modell resultierte. Wir beleuchteten, wie sich explizite A-priori-Spezifikationen auf implizit induzierte A-priori-Verteilungen auswirken, die bei Cluster-Anwendungen oft von größerem Interesse sind. Wir schlugen den Teleskop-Sampler für die Schätzung des generalisierten MFM-Modells sowie einen effizienten Markov-Ketten-Monte-Carlo-Algorithmus für das Mixture-of-Experts Modell vor. Insgesamt helfen die Projektergebnisse dabei, Bayesianische Mischmodelle generell als auch beim modellbasierten Clustern erfolgreich anzuwenden und somit das statistische Instrumentarium zu erweitern, das zur Analyse komplexer Daten zur Verfügung steht. Um die Projektergebnisse entsprechend zu disseminieren,veröffentlichten wir diese nicht nur in mehreren Forschungsartikeln in Zeitschriften mit Peer-Review, die sich an Experten auf diesem Gebiet richten, sondern auch in leichter zugänglicheren Beiträgen, die als Kapitel im ``CRC Handbook of Mixture Analysis'' und als Beitrag in ``Wiley StatsRef: Statistics Reference Online'' erschienen. Software-Implementierungen einiger während dieses Projekts entwickelten rechenintensiver Methoden wurden als quelloffene R Pakete frei über das Comprehensive R Archive Network unter zur Verfügung gestellt.
- Wirtschaftsuniversität Wien - 100%
- Sara Dolnicar, University of Queensland - Australien
Research Output
- 518 Zitationen
- 25 Publikationen
- 2 Software
- 3 Disseminationen
- 4 Wissenschaftliche Auszeichnungen
- 1 Weitere Förderungen
-
2023
Titel Clusterwise multivariate regression of mixed-type panel data DOI 10.1007/s11222-023-10304-5 Typ Journal Article Autor Vávra J Journal Statistics and Computing Seiten 46 -
2021
Titel How many data clusters are in the Galaxy data set? DOI 10.1007/s11634-021-00461-8 Typ Journal Article Autor Grün B Journal Advances in Data Analysis and Classification Seiten 325-349 Link Publikation -
2021
Titel How many data clusters are in the Galaxy data set? Bayesian cluster analysis in action DOI 10.48550/arxiv.2101.12686 Typ Preprint Autor Grün B -
2022
Titel Spying on the prior of the number of data clusters and the partition distribution in Bayesian cluster analysis DOI 10.1111/anzs.12350 Typ Journal Article Autor Greve J Journal Australian & New Zealand Journal of Statistics Seiten 205-229 Link Publikation -
2022
Titel Advances in Bayesian Mixture Modelling: Contributions to Cluster and Regression Analysis Typ Other Autor Malsiner-Walli G -
2022
Titel Efficient Bayesian Modeling of Binary and Categorical Data in R: The UPG Package Typ Other Autor Frühwirth-Schnatter S Link Publikation -
2022
Titel Ultimate Plya Gamma Samplers - Efficient MCMC for Possibly Imbalanced Binary and Categorical Data Typ Other Autor Frühwirth-Schnatter S Link Publikation -
2022
Titel Bayesian Finite Mixture Models; In: Wiley StatsRef: Statistics Reference Online Typ Book Chapter Autor Grün B Verlag John Wiley & Sons -
2020
Titel Generalized mixtures of finite mixtures and telescoping sampling DOI 10.48550/arxiv.2005.09918 Typ Preprint Autor Frühwirth-Schnatter S -
2021
Titel Generalized Mixtures of Finite Mixtures and Telescoping Sampling DOI 10.1214/21-ba1294 Typ Journal Article Autor Frühwirth-Schnatter S Journal Bayesian Analysis Seiten 1279-1307 Link Publikation -
2022
Titel Advances in Bayesian mixture modelling: Contributions to cluster and regression analysis Typ Postdoctoral Thesis Autor Gertraud Malsiner-Walli -
2022
Titel Clusterwise multivariate regression of mixed-type panel data DOI 10.21203/rs.3.rs-1882841/v1 Typ Preprint Autor Vávra J Link Publikation -
2019
Titel Handbook of Mixture Analysis DOI 10.1201/9780429055911 Typ Book editors Frühwirth-Schnatter S, Celeux G, Robert C Verlag Taylor & Francis Link Publikation -
2019
Titel Mixture of Experts Models DOI 10.1201/9780429055911-12 Typ Book Chapter Autor Gormley I Verlag Taylor & Francis Seiten 271-307 -
2019
Titel Model-Based Clustering DOI 10.1201/9780429055911-8 Typ Book Chapter Autor Grün B Verlag Taylor & Francis Seiten 157-192 -
2019
Titel Model Selection for Mixture Models – Perspectives and Strategies DOI 10.1201/9780429055911-7 Typ Book Chapter Autor Celeux G Verlag Taylor & Francis Seiten 117-154 Link Publikation -
2019
Titel Computational Solutions for Bayesian Inference in Mixture Models DOI 10.1201/9780429055911-5 Typ Book Chapter Autor Celeux G Verlag Taylor & Francis Seiten 73-96 Link Publikation -
2019
Titel Special issue on “Advances on model-based clustering and classification” DOI 10.1007/s11634-019-00355-w Typ Journal Article Autor Frühwirth-Schnatter S Journal Advances in Data Analysis and Classification Seiten 1-5 Link Publikation -
2019
Titel Semi-parametric Regression under Model Uncertainty: Economic Applications DOI 10.1111/obes.12294 Typ Journal Article Autor Malsiner-Walli G Journal Oxford Bulletin of Economics and Statistics Seiten 1117-1143 Link Publikation -
2019
Titel Keeping the balance—Bridge sampling for marginal likelihood estimation in finite mixture, mixture of experts and Markov mixture models DOI 10.1214/19-bjps446 Typ Journal Article Autor Frühwirth-Schnatter S Journal Brazilian Journal of Probability and Statistics Seiten 706-733 Link Publikation -
2017
Titel From here to infinity - sparse finite versus Dirichlet process mixtures in model-based clustering DOI 10.48550/arxiv.1706.07194 Typ Preprint Autor Frühwirth-Schnatter S -
2017
Titel Effect fusion using model-based clustering DOI 10.48550/arxiv.1703.07603 Typ Preprint Autor Malsiner-Walli G -
2018
Titel From here to infinity: sparse finite versus Dirichlet process mixtures in model-based clustering DOI 10.1007/s11634-018-0329-y Typ Journal Article Autor Frühwirth-Schnatter S Journal Advances in Data Analysis and Classification Seiten 33-64 Link Publikation -
2018
Titel Effect fusion using model-based clustering DOI 10.1177/1471082x17739058 Typ Journal Article Autor Malsiner-Walli G Journal Statistical Modelling Seiten 175-196 Link Publikation -
2017
Titel The resurrection of the PIDDosome – emerging roles in the DNA-damage response and centrosome surveillance DOI 10.1242/jcs.203448 Typ Journal Article Autor Sladky V Journal Journal of Cell Science Seiten 3779-3787 Link Publikation
-
2019
Link
Titel Organizing the workshop "26th Summer Working Group on Model-Based Clustering" Typ Participation in an activity, workshop or similar Link Link -
2022
Link
Titel Session Organizer at the "Austrian and Slovenian Statistical Days 2022" Typ Participation in an activity, workshop or similar Link Link -
2020
Link
Titel Organizing the workshop "Bayes@Austria" Typ Participation in an activity, workshop or similar Link Link
-
2022
Titel Austrian and Slovenian Statistical Days Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International -
2021
Titel 22nd European Young Statisticians Meeting Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International -
2021
Titel 3rd Insurance Data Science Conference Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International -
2019
Titel CLADAG Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International
-
2020
Titel WU Projects Typ Research grant (including intramural programme) Förderbeginn 2020