Evaluierung von Prozeduren bei adaptiven Designs
Evaluation of Adaptive Design Procedures
Wissenschaftsdisziplinen
Andere Humanmedizin, Gesundheitswissenschaften (60%); Informatik (20%); Mathematik (20%)
Keywords
-
Adaptive Designs,
Interim Analysis,
Design Modifications,
Group Sequential Designs,
Confidence Intervals
Zwischenauswertungen werden in medizinischen Studien, z.B. in klinischen Versuchen, aus ethischen und ökonomischen Gründen angewendet. Einerseits sollten Studien nicht ausgedehnt (und damit Entscheidungen verzögert) werden, falls es eine klare Tendenz zugunsten einer speziellen Beahandlung gibt, damit auch andere Patienten möglichst rasch davon profitieren können. Andererseits sollten keine zusätzlichen Patienten mit einem neuen therapeutischen Konzept (- für welches in solch einer Situation nur begrenztes Wissen über die Risiken vorhanden ist -) behandelt werden, wenn der laufende Versuch kein Indiz für einen möglichen Patienten-nutzen liefert. Außerdem können sequentielle Versuche mit frühen Entscheidungen die Entwicklungskosten für verbesserte Therapien senken. Am häufigsten werden in der Medizin gruppensequentielle Tests mit einer geringen Zahl an geplanten Zwischenanalysen verwendet. Bei diesen Designs müssen die Zahl an Zwischen-analysen, die Gruppengrößen und die Entscheidungsgrenzen a-priori in der Planungsphase festgesetzt werden. "Optimale" Versuche hängen im allgemeinen von anderen Faktoren ab, z.B. vom Wert des relevanten Behandlungseffektes, der Variabilität, dem anzuwendenden statistischen Modells und vieler anderer. Wären diese Dinge alle in der benötigten Genauigkeit von vornherein bekannt, wäre die Durchführung eines Versuches vermutlich unethisch. Adaptive sequentielle Designs erlauben Änderungen des Versuchsplanes auf der Basis von Informationen, die bis zu den Zwischenanalysen inner- oder außerhalb des Versuches anfallen. Damit können mögliche Misspezifiaktionen aus der Planungsphase noch während des Versuches korrigiert werden. Um den Fehler 1. Art zu kontrollieren, befolgen adaptive Designs eine einfache allgemeine Regel: Es werden separate Teststatistiken für die Stichproben der einzelnen Stufen berechnet und in einer vordefinierten Weise kombiniert. Jede Designmodifikation, die unter der Nullhypothese die Verteilungseigenschaften der separaten Teststatistiken bewahrt, führt zur keiner Erhöhung des alpha-Niveaus [z.B. Bauer, Brannath & Posch, 2001]. Wegen der breiten Flexibilität dieser Methoden (die sich auf die Zahl der Zwischenanalysen ausdehnen lässt), ist es schwierig, ihre Vorteile bei angewandten Probleme abzuschätzen. Das Ziel dieses Forschungsprojektes ist es, adaptive Designs hinsichtlich ihrer Güte, der durchschnittlichen Stichprobengröße und ihrer Schätzer zu untersuchen. Es werden exakte Berechnungen unter einfachen Verteilungsannahmen (Normal) und Simulationen (z.B.: für Überlebenszeitstudien) durchgeführt, um die Methoden mit klassischen Ansätzen zu vergleichen (z.B. mit einstufgen und gruppensequentiellen Tests). Besonderes Augenmerk wird auf die Korrektur von Fehl- spezifikationen der Planungsphase durch Designänderungen in Zwischenauswertungen gerichtet.
Ein adaptives Studiendesign erlaubt Designmodifikationen während einer laufenden Studie, die auf Daten aus der laufenden Studie selbst oder auf Informationen von außerhalb basieren, ohne dabei die Wahrscheinlichkeit einer Falsch-positiven Testentscheidung zu erhöhen. Bei der üblichen Vorgangsweise müssen im Gegensatz dazu die Designspezifikationen immer a priori fixiert werden. Das Hauptinteresse lag zu Beginn auf der Modifikation der Fallzahl. Wir haben Vor- und Nachteile von Neuberechnungen in Interimanalysen untersucht. Es konnte gezeigt werden, dass eine Re-Evaluierung der Chancen das vorgegebene Ziel in der Endanalyse zu erreichen, schlechte Schätzungen der wahren Wahrscheinlichkeit erzeugt, vor allem wenn die Interimanalyse sehr früh angesetzt wird. Verwendet man den beobachteten Effekt der Interimanalyse als Schätzer für den wahren unbekannten Effekt, verursacht dies eine hohe Variabilität in der neu berechneten Stichprobe. Ist die beobachtete Effektgröße höher als die wahre, dann ist die neugeschätzte Fallzahl, die benötigt wird um ein signifikantes Resultat am Ende der Studie zu erhalten, wesentlich kleiner als für den konventionellen Test: Die Berechnung in der Interimanalyse stützt sich auf den beobachteten optimistischen Trend und verwendet gleichzeitig diesen optimistischen Trend anstelle des wahren Effekts um die Erfolgswahrscheinlichkeit zu quantifizieren. Es war uns möglich, Resultate über eine Regel für die Neuberechnung der Fallzahl abzuleiten, die eine minimale mittlere Fallzahl erzeugt. Als ein wichtiges Ergebnis konnten wir zeigen, wie die erwarteten Kosten eines Versuchs reduziert werden können. Eine Möglichkeit ist, dass später geplante Interimanalysen übersprungen werden, falls die Chancen zu einer frühen positiven Entscheidung zu gelangen nur sehr klein sind. Eine andere Möglichkeit ist es eine ungeplante Interimanalyse einzufügen, wenn die Chancen für eine frühe positive Entscheidung sehr hoch sind. Ein wichtiges Problem stellt die Änderung von Endpunkten in klinischen Studien dar. Es wird zum Beispiel ein Versuch mit dem Ziel "Nicht-Unterlegenheit" einer neuen Behandlung im Vergleich zu einer aktiven Kontrollbehandlung zu zeigen gestartet. In der Interimanalyse zeigt sich möglicherweise, dass die neue Behandlung der Kontrolle überlegen ist. Wir haben gezeigt, welche unterschiedlichen Typen von sequentiellen Entscheidungsgrenzen in einem Versuch mit simultanen sequentiellen Tests für "Nicht-Unterlegenheit" und Überlegenheit verwendet werden können. Während der Projektlaufzeit sind Gen-Assoziationsstudien ein neuer wichtiger Bereich in der medizinischen Forschung geworden. Wir haben das Verhalten von zweistufigen Designs bei einer sehr großen Anzahl von Hypothesen und einer sehr kleinen Fallzahl pro Hypothese untersucht. Unter der Annahme von beschränkten Kosten haben wir optimale Zweistufenpläne abgeleitet, die die False Discovery Rate kontrollieren. Die False Discovery Rate ist definiert ist als der erwartete Anteil von falsch-positiven Entscheidungen unter allen signifikanten Markern. Um dabei eine möglichst hohe mittlere Anzahl von effektiven Markern zu identifizieren, sollten etwa drei Viertel aller verfügbaren Beobachtungen in der ersten Stufe verwendet werden, wo dann circa 10% der Hypothesen selektiert und in einer zweiten Stufe genauer untersucht werden sollen. Abgesehen von weiterer methodischer Arbeit gemäß unseres Projektplans, wurde der Schwerpunkt auf innovative Protokolle in speziellen klinischen Studienfragen festgelegt, die die Bereiche Behandlungsselektion, multiples Testen und Parameterschätzung umfassen.
Research Output
- 622 Zitationen
- 8 Publikationen
-
2018
Titel Characterization of the thymus in Lrp4 myasthenia gravis: Four cases DOI 10.1016/j.autrev.2018.07.011 Typ Journal Article Autor Koneczny I Journal Autoimmunity Reviews Seiten 50-55 Link Publikation -
2016
Titel IgG4 autoantibodies against muscle-specific kinase undergo Fab-arm exchange in myasthenia gravis patients DOI 10.1016/j.jaut.2016.11.005 Typ Journal Article Autor Koneczny I Journal Journal of Autoimmunity Seiten 104-115 Link Publikation -
2017
Titel Characterization of an anti-fetal AChR monoclonal antibody isolated from a myasthenia gravis patient DOI 10.1038/s41598-017-14350-8 Typ Journal Article Autor Saxena A Journal Scientific Reports Seiten 14426 Link Publikation -
2006
Titel Estimation in flexible two stage designs DOI 10.1002/sim.2258 Typ Journal Article Autor Brannath W Journal Statistics in Medicine Seiten 3366-3381 -
2005
Titel The reassessment of trial perspectives from interim data—a critical view DOI 10.1002/sim.2180 Typ Journal Article Autor Bauer P Journal Statistics in Medicine Seiten 23-36 -
2005
Titel Two-stage designs for experiments with a large number of hypotheses DOI 10.1093/bioinformatics/bti604 Typ Journal Article Autor Zehetmayer S Journal Bioinformatics Seiten 3771-3777 Link Publikation -
2005
Titel Testing and estimation in flexible group sequential designs with adaptive treatment selection DOI 10.1002/sim.2389 Typ Journal Article Autor Posch M Journal Statistics in Medicine Seiten 3697-3714 Link Publikation -
2004
Titel Optimal Conditional Error Functions for the Control of Conditional Power DOI 10.1111/j.0006-341x.2004.00221.x Typ Journal Article Autor Brannath W Journal Biometrics Seiten 715-723