Wiederholte Signifikanztests bei Kontrolle der False Discovery Rate
Repeated Significance Tests controlling the False Discovery Rate
Wissenschaftsdisziplinen
Biologie (70%); Informatik (20%); Mathematik (10%)
Keywords
-
Multiple Testing,
Group-Sequential Design,
Stopping Rules,
False Negative Rate,
Gene Expression Study,
Gene Disease Association Study
Im Rahmen genetischer Studien, wie Microarray- oder Gen-Assoziations-Experimenten, werden hoch- dimensionale Daten generiert, bei deren Analyse oft tausende Hypothesentests durchgeführt werden. Um für das resultierende multiple Testproblem zu adjustieren, müssen Methoden angewendet werden, die globale Fehlerkriterien, wie z.B. die "family-wise Type I error rate" oder die "false discovery rate" (FDR), kontrollieren. Im Kontext solcher multipler Testprozeduren wollen wir neue gruppensequentielle, wiederholte Signifikanztests untersuchen. Es ist bekannt, dass durch die Anwendun g sequentieller Prozeduren bei hoch-dimensionalen Daten eine beträchtliche Effizienzsteigerung im Vergleich zu Tests mit fixem Stichprobenumfang möglich ist. Der Schwerpunkt dieses Forschungsprojektes liegt auf den kürzlich entwickelten SISS Prozeduren (simultaneous stopping of sampling). Hier wird die Datenerhebung für alle Hypothesen in der gleichen Interimanalyse gestoppt. Im Gegensatz dazu stehen gruppensequentielle ISS Prozeduren (individual stopping of sampling) bei denen die Datenerhebung für eine Hypothese gestoppt wird, sobald die Teststatistik der Hypothese eine vorgegebene Stoppgrenze überschreitet. Das Forschungsprojekt besteht aus zwei Stufen: Zuerst werden SISS Prozeduren, die die FDR kontrollieren, umfassend evaluiert. Wir möchten neue Stoppregeln betrachten und das Verfahren unter verschiedenen Szenarien studieren. Insbesondere möchten wir die Operationscharakteristik der sequentiellen Prozedur im endlichen Fall via Simulationen untersuchen. Hier werden wir auch Szenarien mit korrelierten Teststatistiken, unterschiedlicher Verteilung der Effektgrößen für die Alternativen und für verschiedene Teststatistiken untersuchen. Im zweiten Schritt betrachten wir mehrere Erweiterungen der SISS Prozeduren. Zum Beispiel sollen Verfahren mit datenabhängigen Fallzahlanpassungen betrachtet werden. Dabei wird die Fallzahl der zukünftigen Stufen abhängig von den bisher beobachteten Daten festgelegt. Eine andere Erweiterung sind Prozeduren, die Aspekte des ISS und SISS Designs kombinieren. Es handelt sich dabei um eine Variante der ISS Prozedur, bei der, zusätzlich zum individuellen Stoppen der Datenerhebung, auch die Möglichkeit besteht, das gesamte Experiment (und damit die Datenerhebung für alle Hypothesen simultan) zu stoppen, sofern in einer Interimanalyse ein bestimmter Anteil von Hypothesen abgelehnt werden kann. Wir möchten untersuchen, unter welchen Voraussetzungen nur für die tatsächliche Anzahl durchgeführter Interimanalysen adjustiert werden muss, um die FDR zu kontrollieren. Wiederum werden wir Simulationen einsetzen, um die Operationscharakteristiken dieser Prozedur zu untersuchen. Basierend auf Datensätzen von Microarray und Proteomics Experimenten werden wir die Prozedur im Kontext von konkreten genetischen Fragestellungen evaluieren.
- Martin Posch, Medizinische Universität Wien , assoziierte:r Forschungspartner:in
Research Output
- 18 Zitationen
- 2 Publikationen
-
2010
Titel Post hoc power estimation in large-scale multiple testing problems DOI 10.1093/bioinformatics/btq085 Typ Journal Article Autor Zehetmayer S Journal Bioinformatics Seiten 1050-1056 Link Publikation -
2012
Titel False discovery rate control in two-stage designs DOI 10.1186/1471-2105-13-81 Typ Journal Article Autor Zehetmayer S Journal BMC Bioinformatics Seiten 81 Link Publikation