• Zum Inhalt springen (Accesskey 1)
  • Zur Suche springen (Accesskey 7)
FWF — Österreichischer Wissenschaftsfonds
  • Zur Übersichtsseite Entdecken

    • Forschungsradar
      • Historisches Forschungsradar 1974–1994
    • Entdeckungen
      • Emmanuelle Charpentier
      • Adrian Constantin
      • Monika Henzinger
      • Ferenc Krausz
      • Wolfgang Lutz
      • Walter Pohl
      • Christa Schleper
      • Elly Tanaka
      • Anton Zeilinger
    • Impact Stories
      • Verena Gassner
      • Wolfgang Lechner
      • Georg Winter
    • scilog-Magazin
    • Austrian Science Awards
      • FWF-Wittgenstein-Preise
      • FWF-ASTRA-Preise
      • FWF-START-Preise
      • Auszeichnungsfeier
    • excellent=austria
      • Clusters of Excellence
      • Emerging Fields
    • Im Fokus
      • 40 Jahre Erwin-Schrödinger-Programm
      • Quantum Austria
      • Spezialforschungsbereiche
    • Dialog und Diskussion
      • think.beyond Summit
      • Am Puls
      • Was die Welt zusammenhält
      • FWF Women’s Circle
      • Science Lectures
    • Wissenstransfer-Events
    • E-Book Library
  • Zur Übersichtsseite Fördern

    • Förderportfolio
      • excellent=austria
        • Clusters of Excellence
        • Emerging Fields
      • Projekte
        • Einzelprojekte
        • Einzelprojekte International
        • Klinische Forschung
        • 1000 Ideen
        • Entwicklung und Erschließung der Künste
        • FWF-Wittgenstein-Preis
      • Karrieren
        • ESPRIT
        • FWF-ASTRA-Preise
        • Erwin Schrödinger
        • doc.funds
        • doc.funds.connect
      • Kooperationen
        • Spezialforschungsgruppen
        • Spezialforschungsbereiche
        • Forschungsgruppen
        • International – Multilaterale Initiativen
        • #ConnectingMinds
      • Kommunikation
        • Top Citizen Science
        • Wissenschaftskommunikation
        • Buchpublikationen
        • Digitale Publikationen
        • Open-Access-Pauschale
      • Themenförderungen
        • AI Mission Austria
        • Belmont Forum
        • ERA-NET HERA
        • ERA-NET NORFACE
        • ERA-NET QuantERA
        • ERA-NET TRANSCAN
        • Ersatzmethoden für Tierversuche
        • Europäische Partnerschaft Biodiversa+
        • Europäische Partnerschaft BrainHealth
        • Europäische Partnerschaft ERA4Health
        • Europäische Partnerschaft ERDERA
        • Europäische Partnerschaft EUPAHW
        • Europäische Partnerschaft FutureFoodS
        • Europäische Partnerschaft OHAMR
        • Europäische Partnerschaft PerMed
        • Europäische Partnerschaft Water4All
        • Gottfried-und-Vera-Weiss-Preis
        • netidee SCIENCE
        • Projekte der Herzfelder-Stiftung
        • Quantum Austria
        • Rückenwind-Förderbonus
        • WE&ME Award
        • Zero Emissions Award
      • Länderkooperationen
        • Belgien/Flandern
        • Deutschland
        • Frankreich
        • Italien/Südtirol
        • Japan
        • Korea
        • Luxemburg
        • Polen
        • Schweiz
        • Slowenien
        • Taiwan
        • Tirol–Südtirol–Trentino
        • Tschechien
        • Ungarn
    • Schritt für Schritt
      • Förderung finden
      • Antrag einreichen
      • Internationales Peer-Review
      • Förderentscheidung
      • Projekt durchführen
      • Projekt beenden
      • Weitere Informationen
        • Integrität und Ethik
        • Inklusion
        • Antragstellung aus dem Ausland
        • Personalkosten
        • PROFI
        • Projektendberichte
        • Projektendberichtsumfrage
    • FAQ
      • Projektphase PROFI
      • Projektphase Ad personam
      • Auslaufende Programme
        • Elise Richter und Elise Richter PEEK
        • FWF-START-Preise
  • Zur Übersichtsseite Über uns

    • Leitbild
    • FWF-Film
    • Werte
    • Zahlen und Daten
    • Jahresbericht
    • Aufgaben und Aktivitäten
      • Forschungsförderung
        • Matching-Funds-Förderungen
      • Internationale Kooperationen
      • Studien und Publikationen
      • Chancengleichheit und Diversität
        • Ziele und Prinzipien
        • Maßnahmen
        • Bias-Sensibilisierung in der Begutachtung
        • Begriffe und Definitionen
        • Karriere in der Spitzenforschung
      • Open Science
        • Open-Access-Policy
          • Open-Access-Policy für begutachtete Publikationen
          • Open-Access-Policy für begutachtete Buchpublikationen
          • Open-Access-Policy für Forschungsdaten
        • Forschungsdatenmanagement
        • Citizen Science
        • Open-Science-Infrastrukturen
        • Open-Science-Förderung
      • Evaluierungen und Qualitätssicherung
      • Wissenschaftliche Integrität
      • Wissenschaftskommunikation
      • Philanthropie
      • Nachhaltigkeit
    • Geschichte
    • Gesetzliche Grundlagen
    • Organisation
      • Gremien
        • Präsidium
        • Aufsichtsrat
        • Delegiertenversammlung
        • Kuratorium
        • Jurys
      • Geschäftsstelle
    • Arbeiten im FWF
  • Zur Übersichtsseite Aktuelles

    • News
    • Presse
      • Logos
    • Eventkalender
      • Veranstaltung eintragen
      • FWF-Infoveranstaltungen
    • Jobbörse
      • Job eintragen
    • Newsletter
  • Entdecken, 
    worauf es
    ankommt.

    FWF-Newsletter Presse-Newsletter Kalender-Newsletter Job-Newsletter scilog-Newsletter

    SOCIAL MEDIA

    • LinkedIn, externe URL, öffnet sich in einem neuen Fenster
    • , externe URL, öffnet sich in einem neuen Fenster
    • Facebook, externe URL, öffnet sich in einem neuen Fenster
    • Instagram, externe URL, öffnet sich in einem neuen Fenster
    • YouTube, externe URL, öffnet sich in einem neuen Fenster

    SCILOG

    • Scilog — Das Wissenschaftsmagazin des Österreichischen Wissenschaftsfonds (FWF)
  • elane-Login, externe URL, öffnet sich in einem neuen Fenster
  • Scilog externe URL, öffnet sich in einem neuen Fenster
  • en Switch to English

  

Schrumpfen und Regularisieren von Finiten Mischmodellen

Shrinking and Regularizing Finite Mixture Models

Sylvia Frühwirth-Schnatter (ORCID: 0000-0003-0516-5552)
  • Grant-DOI 10.55776/P28740
  • Förderprogramm Einzelprojekte
  • Status beendet
  • Projektbeginn 01.11.2016
  • Projektende 30.04.2022
  • Bewilligungssumme 260.612 €

Wissenschaftsdisziplinen

Informatik (5%); Mathematik (85%); Wirtschaftswissenschaften (10%)

Keywords

    Finite mixture model, Unobserved heterogeneity, Bayesian estimation, Conjugate prior, Regularization, Shrinkage

Abstract Endbericht

Es wird oft vermutet, dass Gruppen von Beobachtungen mit unterschiedlichen Charakteristika in Daten vorhanden sind. Jedoch sind die Gruppenzugehörigkeiten entweder nicht verfügbar oder nicht beobachtbar. In dieser Situation muss eine statistische Methode in der Datenanalyse verwendet werden, die explizit erlaubt, das Auftreten von latenten Gruppen zu berücksichtigen, und die versucht, sowohl die Gruppengrößen als auch Gruppencharakteristika zu bestimmen. Das Standardwerkzeug für dieses Problem bei der statistischen Analyse basierend auf einem statistischen Modell ist das finite Mischmodell. Finite Mischmodelle werden seit mehr als 100 Jahren verwendet und stellen ein flexibles und generell anwendbares statistisches Werkzeug dar, für das bereits viele Erweiterungen und Varianten vorgeschlagen wurden. Jedoch sind manche Probleme immer noch ungelöst, wie die korrekte Selektion der Variablen für die Analyse, die die Gruppenstruktur festlegen, und die Auswahl eines geeigneten Modells, das eine Überanpassung an die Heterogenität vermeidet, um eine leichte Interpretierbarkeit und ein konzises Schätzen der Parameter zu ermöglichen. In dem vorliegenden Forschungsprojekt werden wir versuchen, die Anwendung von finiten Mischmodellen zu verbessern, indem wir Werkzeuge basierend auf Schrumpfen (Shrinkage) und Regularisierung entwickeln, die die Auswahl eines geeigneten Modells ermöglichen, wobei zwischen relevanten und irrelevanten Variablen automatisch unterschieden wird, und die Parameter auf eine Art und Weise festgelegt werden, sodass Überanpassung vermieden wird. Die theoretischen Resultate werden durch Anwendungen und eine Implementierung in Software komplementiert, die in Form von Erweiterungspaketen für die quelloffene Software R, einer Umgebung für statistisches Rechnen und Graphik (http://www.R-project.org), erfolgen wird. The Verfügbarkeit von verbesserten statistischen Methoden in Kombination mit Softwareimplementierungen erlaubt die bessere Analyse und ein erweitertes Verständnis für die Daten in empirischen, quantitativen Analysen. Aufgrund der weiten Anwendungsmöglichkeiten von finiten Mischmodellen, z.B. in der Astronomie, Biologie, Ökonomie, Marketing, Medizin und Psychologie, kann angenommen werden, dass die Resultate dieses Forschungsprojekts auch eine Auswirkung auf andere Forschungsbereiche haben, indem ein verbesserter Einblick in die latente Gruppenstruktur, die in den Daten vorhanden ist, gewonnen wird.

Clusteranalyse ist eine statistische Methode, die erlaubt, Struktur in Daten mithilfe des Gruppierens von Beobachtungen zu erkennen.Clusteranalyse wird in vielen verschiedenen Bereichen eingesetzt, in denen Daten analysiert werden. Der modellbasierte Ansatz zur Clusteranalyse bettet das Cluster-Problem in die Methodik der statistischen Inferenz ein und verwendet dabei Mischmodelle als zugrundeliegendes datengenerierendes Modell. Der modellbasierte Ansatz ist reizvoll, da statistische Inferenzverfahren zum Beantworten von relevanten Fragestellungen bei der Clusteranalyse herangezogen werden können. Weiters sind Erweiterungen direkt verfügbar, indem man andere statistische Modelle für die Komponenten des Mischmodells verwendet. Das Verfolgen eines Bayesianischen Ansatzes erleichtert das Einbeziehen von Vorinformation in die Modellierung, wie das Wissen im Bezug auf die Clusterformen oder deren Anzahl. Dadurch wird die Ambiguität des Cluster-Problems reduziert, und man findet leichter geeignete Clusterlösungen. In diesem Projekt entwickelten wir die Bayesianische Modellierung von Mischmodellen mit Fokus auf die Anwendung beim modellbasierten Clustern weiter. Wir verfolgten einen ganzheitlichen Ansatz, wobei wir generelle Aspekte wie die Spezifikation der A-priori-Verteilungen sowie des Modells selbst als auch deren Schätzung und allgemeine Überlegungen im Bezug auf die erfolgreiche Anwendung abdeckten. Wir versuchten eine Brücke zwischen endlichen und unendlichen Mischmodellen zu schlagen, indem wir Gemeinsamkeiten, aber auch wesentliche Unterschiede zwischen den beiden Modellklassen herausarbeiteten. Wir untersuchten die Annahme einer A-priori-Verteilung für die Zahl der Komponenten, um die Modellunsicherheit zu berücksichtigen, und erhielten damit eine vollständige Bayesianische Modellspezifikation, die im generalisierten Mischung-endlicher-Mischungen (MFM) Modell resultierte. Wir beleuchteten, wie sich explizite A-priori-Spezifikationen auf implizit induzierte A-priori-Verteilungen auswirken, die bei Cluster-Anwendungen oft von größerem Interesse sind. Wir schlugen den Teleskop-Sampler für die Schätzung des generalisierten MFM-Modells sowie einen effizienten Markov-Ketten-Monte-Carlo-Algorithmus für das Mixture-of-Experts Modell vor. Insgesamt helfen die Projektergebnisse dabei, Bayesianische Mischmodelle generell als auch beim modellbasierten Clustern erfolgreich anzuwenden und somit das statistische Instrumentarium zu erweitern, das zur Analyse komplexer Daten zur Verfügung steht. Um die Projektergebnisse entsprechend zu disseminieren,veröffentlichten wir diese nicht nur in mehreren Forschungsartikeln in Zeitschriften mit Peer-Review, die sich an Experten auf diesem Gebiet richten, sondern auch in leichter zugänglicheren Beiträgen, die als Kapitel im ``CRC Handbook of Mixture Analysis'' und als Beitrag in ``Wiley StatsRef: Statistics Reference Online'' erschienen. Software-Implementierungen einiger während dieses Projekts entwickelten rechenintensiver Methoden wurden als quelloffene R Pakete frei über das Comprehensive R Archive Network unter zur Verfügung gestellt.

Forschungsstätte(n)
  • Wirtschaftsuniversität Wien - 100%
Internationale Projektbeteiligte
  • Sara Dolnicar, University of Queensland - Australien

Research Output

  • 518 Zitationen
  • 25 Publikationen
  • 2 Software
  • 3 Disseminationen
  • 4 Wissenschaftliche Auszeichnungen
  • 1 Weitere Förderungen
Publikationen
  • 2023
    Titel Clusterwise multivariate regression of mixed-type panel data
    DOI 10.1007/s11222-023-10304-5
    Typ Journal Article
    Autor Vávra J
    Journal Statistics and Computing
    Seiten 46
  • 2021
    Titel How many data clusters are in the Galaxy data set?
    DOI 10.1007/s11634-021-00461-8
    Typ Journal Article
    Autor Grün B
    Journal Advances in Data Analysis and Classification
    Seiten 325-349
    Link Publikation
  • 2021
    Titel How many data clusters are in the Galaxy data set? Bayesian cluster analysis in action
    DOI 10.48550/arxiv.2101.12686
    Typ Preprint
    Autor Grün B
  • 2022
    Titel Spying on the prior of the number of data clusters and the partition distribution in Bayesian cluster analysis
    DOI 10.1111/anzs.12350
    Typ Journal Article
    Autor Greve J
    Journal Australian & New Zealand Journal of Statistics
    Seiten 205-229
    Link Publikation
  • 2022
    Titel Advances in Bayesian Mixture Modelling: Contributions to Cluster and Regression Analysis
    Typ Other
    Autor Malsiner-Walli G
  • 2022
    Titel Efficient Bayesian Modeling of Binary and Categorical Data in R: The UPG Package
    Typ Other
    Autor Frühwirth-Schnatter S
    Link Publikation
  • 2022
    Titel Ultimate Plya Gamma Samplers - Efficient MCMC for Possibly Imbalanced Binary and Categorical Data
    Typ Other
    Autor Frühwirth-Schnatter S
    Link Publikation
  • 2022
    Titel Bayesian Finite Mixture Models; In: Wiley StatsRef: Statistics Reference Online
    Typ Book Chapter
    Autor Grün B
    Verlag John Wiley & Sons
  • 2020
    Titel Generalized mixtures of finite mixtures and telescoping sampling
    DOI 10.48550/arxiv.2005.09918
    Typ Preprint
    Autor Frühwirth-Schnatter S
  • 2021
    Titel Generalized Mixtures of Finite Mixtures and Telescoping Sampling
    DOI 10.1214/21-ba1294
    Typ Journal Article
    Autor Frühwirth-Schnatter S
    Journal Bayesian Analysis
    Seiten 1279-1307
    Link Publikation
  • 2022
    Titel Advances in Bayesian mixture modelling: Contributions to cluster and regression analysis
    Typ Postdoctoral Thesis
    Autor Gertraud Malsiner-Walli
  • 2022
    Titel Clusterwise multivariate regression of mixed-type panel data
    DOI 10.21203/rs.3.rs-1882841/v1
    Typ Preprint
    Autor Vávra J
    Link Publikation
  • 2019
    Titel Handbook of Mixture Analysis
    DOI 10.1201/9780429055911
    Typ Book
    editors Frühwirth-Schnatter S, Celeux G, Robert C
    Verlag Taylor & Francis
    Link Publikation
  • 2019
    Titel Mixture of Experts Models
    DOI 10.1201/9780429055911-12
    Typ Book Chapter
    Autor Gormley I
    Verlag Taylor & Francis
    Seiten 271-307
  • 2019
    Titel Model-Based Clustering
    DOI 10.1201/9780429055911-8
    Typ Book Chapter
    Autor Grün B
    Verlag Taylor & Francis
    Seiten 157-192
  • 2019
    Titel Model Selection for Mixture Models – Perspectives and Strategies
    DOI 10.1201/9780429055911-7
    Typ Book Chapter
    Autor Celeux G
    Verlag Taylor & Francis
    Seiten 117-154
    Link Publikation
  • 2019
    Titel Computational Solutions for Bayesian Inference in Mixture Models
    DOI 10.1201/9780429055911-5
    Typ Book Chapter
    Autor Celeux G
    Verlag Taylor & Francis
    Seiten 73-96
    Link Publikation
  • 2019
    Titel Special issue on “Advances on model-based clustering and classification”
    DOI 10.1007/s11634-019-00355-w
    Typ Journal Article
    Autor Frühwirth-Schnatter S
    Journal Advances in Data Analysis and Classification
    Seiten 1-5
    Link Publikation
  • 2019
    Titel Semi-parametric Regression under Model Uncertainty: Economic Applications
    DOI 10.1111/obes.12294
    Typ Journal Article
    Autor Malsiner-Walli G
    Journal Oxford Bulletin of Economics and Statistics
    Seiten 1117-1143
    Link Publikation
  • 2019
    Titel Keeping the balance—Bridge sampling for marginal likelihood estimation in finite mixture, mixture of experts and Markov mixture models
    DOI 10.1214/19-bjps446
    Typ Journal Article
    Autor Frühwirth-Schnatter S
    Journal Brazilian Journal of Probability and Statistics
    Seiten 706-733
    Link Publikation
  • 2017
    Titel From here to infinity - sparse finite versus Dirichlet process mixtures in model-based clustering
    DOI 10.48550/arxiv.1706.07194
    Typ Preprint
    Autor Frühwirth-Schnatter S
  • 2017
    Titel Effect fusion using model-based clustering
    DOI 10.48550/arxiv.1703.07603
    Typ Preprint
    Autor Malsiner-Walli G
  • 2018
    Titel From here to infinity: sparse finite versus Dirichlet process mixtures in model-based clustering
    DOI 10.1007/s11634-018-0329-y
    Typ Journal Article
    Autor Frühwirth-Schnatter S
    Journal Advances in Data Analysis and Classification
    Seiten 33-64
    Link Publikation
  • 2018
    Titel Effect fusion using model-based clustering
    DOI 10.1177/1471082x17739058
    Typ Journal Article
    Autor Malsiner-Walli G
    Journal Statistical Modelling
    Seiten 175-196
    Link Publikation
  • 2017
    Titel The resurrection of the PIDDosome – emerging roles in the DNA-damage response and centrosome surveillance
    DOI 10.1242/jcs.203448
    Typ Journal Article
    Autor Sladky V
    Journal Journal of Cell Science
    Seiten 3779-3787
    Link Publikation
Software
  • 2022 Link
    Titel UPG: Efficient Bayesian Algorithms for Binary and Categorical Data Regression Models
    Link Link
  • 2021 Link
    Titel fipp: Induced Priors in Bayesian Mixture Models
    Link Link
Disseminationen
  • 2019 Link
    Titel Organizing the workshop "26th Summer Working Group on Model-Based Clustering"
    Typ Participation in an activity, workshop or similar
    Link Link
  • 2022 Link
    Titel Session Organizer at the "Austrian and Slovenian Statistical Days 2022"
    Typ Participation in an activity, workshop or similar
    Link Link
  • 2020 Link
    Titel Organizing the workshop "Bayes@Austria"
    Typ Participation in an activity, workshop or similar
    Link Link
Wissenschaftliche Auszeichnungen
  • 2022
    Titel Austrian and Slovenian Statistical Days
    Typ Personally asked as a key note speaker to a conference
    Bekanntheitsgrad Continental/International
  • 2021
    Titel 22nd European Young Statisticians Meeting
    Typ Personally asked as a key note speaker to a conference
    Bekanntheitsgrad Continental/International
  • 2021
    Titel 3rd Insurance Data Science Conference
    Typ Personally asked as a key note speaker to a conference
    Bekanntheitsgrad Continental/International
  • 2019
    Titel CLADAG
    Typ Personally asked as a key note speaker to a conference
    Bekanntheitsgrad Continental/International
Weitere Förderungen
  • 2020
    Titel WU Projects
    Typ Research grant (including intramural programme)
    Förderbeginn 2020

Entdecken, 
worauf es
ankommt.

Newsletter

FWF-Newsletter Presse-Newsletter Kalender-Newsletter Job-Newsletter scilog-Newsletter

Kontakt

Österreichischer Wissenschaftsfonds FWF
Georg-Coch-Platz 2
(Eingang Wiesingerstraße 4)
1010 Wien

office(at)fwf.ac.at
+43 1 505 67 40

Allgemeines

  • Jobbörse
  • Arbeiten im FWF
  • Presse
  • Philanthropie
  • scilog
  • Geschäftsstelle
  • Social Media Directory
  • LinkedIn, externe URL, öffnet sich in einem neuen Fenster
  • , externe URL, öffnet sich in einem neuen Fenster
  • Facebook, externe URL, öffnet sich in einem neuen Fenster
  • Instagram, externe URL, öffnet sich in einem neuen Fenster
  • YouTube, externe URL, öffnet sich in einem neuen Fenster
  • Cookies
  • Hinweisgeber:innensystem
  • Barrierefreiheitserklärung
  • Datenschutz
  • Impressum
  • IFG-Formular
  • Social Media Directory
  • © Österreichischer Wissenschaftsfonds FWF
© Österreichischer Wissenschaftsfonds FWF