FLIP: Likelihood Schätzungen für Phylogenien
FLIP: Future Likelihood Inferences for Phylogenetics
DACH: Österreich - Deutschland - Schweiz
Wissenschaftsdisziplinen
Informatik (75%); Mathematik (25%)
Keywords
-
Phylogenetic Inference,
Bootstrap In Phylogeny,
Maximum Likelihood Methods,
Phylogenomics,
Maximum Parsimony,
Methods In Molecular Evolution
In Zeiten zunehmend effizienter Sequenziertechniken stellen sich der Bioinformatik neue Herausforderungen, um die bis dato unbekannte Datenflut an molekularen Sequenzen zu handhaben und zu analysieren. Zeitgleich zur Revolution in der Molekularbiologie hat die Rechnertechnologie substantielle Fortschritte gemacht. In dem vorgeschlagenen Projekt wollen wir bioinformatische, statistische und informatische Methoden einsetzen und endwickeln, um auch mit den neuen Daten und neuen Technologien effizient arbeiten zu können. Unser Hauptaugenmerk wird hierbei auf der Rekonstruktion der Verwandtschaftsverhältnisse heute lebender Organismen anhand ihrer Gene liegen. Dazu werden bekannte Methoden der Rekonstruktion der Verwandtschaftsverhältnisse weiter verbessert werden, indem wir die Fortschritte in der Rechnertechnologie nutzen werden. Wir wollen die technologische Entwicklung einsetzen, um Rechenzeit zu sparen und zeitgleich auch mehr Daten pro Zeiteinheit bearbeiten zu können, das erspart nicht nur den Forschern/Forscherinnen Zeit, sondern vermindert auch den Bedarf an elektrischer Energie. Neben der Verbesserung existierender Methoden werden wir auch völlig neuartige statistische Schätzverfahren und Algorithmen entwickeln, um die Datenflut zu bewältigen. Diese Methoden werden in Computerprogrammen integriert und der wissenschaftlichen Gemeinschaft zur Verfügung gestellt. Auf diese Weise möchten wir Rückmeldungen erhalten, die zu einer weiteren Verbesserung und Flexibilisierung unserer Programme führen sollen. Unsere entwickelten Methoden werden es dann ermöglichen, Stammbäume auch für sehr viele Arten zu berechnen. Die Verwandtschaftsverhältnisse werden auf einer soliden statistischen Grundlage berechnet und können somit auf ihre Plausibilität im Vergleich zu anderen Hypothesen über Verwandtschaftsverhältnisse verglichen werden. Die Biologie kommt damit ihrem Ziel, den Stammbaum aller Lebewesen zu berechnen einen deutlichen Schritt weiter.
Mit den ständig wachsenden biologischen Daten ist die Effizienz und Genauigkeit der Berechnungsmethoden für phylogenetische Rückschlüsse eine wichtige Frage für die Rekonstruktion des Stammbaumes aller heutigen Lebewesen (tree of Life) geworden. Die ständige Verbesserung der Software und der Algorithmen ermöglicht die Analyse mittels komplexen evolutionären Modellen auf von großen, sogenannten "phlyogenomics" Daten. Während der Förderperiode haben wir eine Reihe von Zielen erreicht. Erstens stellten wir eine parallelisierte Version unserer Flaggschiff-Software für phylogenetische Inferenz IQ-TREE zur Verfügung. Außerdem stellten wir eine Methode zur Verbesserung der Parameterschätzung unter einem der am häufigsten verwendeten evolutionären Modelle vor, "Invariable Sites plus ", vor. Wir veröffentlichten eine zweite Version der UFBoot-Methode, die häufig zur Schätzung der Signifikanz von evolutionären maximum-likelihood Bäumen verwendet wird. Wir erweiterten den UFBoot Ansatz um auch eine schnelle Schätzung der Verläßlichkeit von Parsimony-Bäumen zu erhalten. Diese neue Methode nennen wir MPBoot. Wir stellten auch ein Werkzeug, ModelFinder, für die schnelle und genaue evolutionäre Modellauswahl zur Verfügung Die wesentliche Neuerung ist die Implementierung einer verteilungsfreien Ratenschätzung, die jeder Position in einer DNA oder einem Protein eine eigene evolutionäre Raten zuordnet. Zu den weiteren Entwicklungen gehört die erstmalige Implementierung der Bauminferenzberechnung unter Berücksichtigung so genannter phylogenetischen Terrassen, die bei fehlenden Daten auftreten. Diese Methode reduziert die benötigte Rechenzeit substantiell. Insgesamt war das Projekt sehr erfolgreich und führte zu vielen theoretischen Entwicklungen, die in IQ-TREE implementiert wurden und von Praktikern für die Inferenz von evolutionären Stammbäume als open-source software verwendet werden können. (Die Software ist verfügbar unter www.iqtree.org).
- Universität Wien - 100%
Research Output
- 36854 Zitationen
- 13 Publikationen
- 1 Software
-
2019
Titel Polymorphism-Aware Species Trees with Advanced Mutation Models, Bootstrap, and Rate Heterogeneity DOI 10.1093/molbev/msz043 Typ Journal Article Autor Schrempf D Journal Molecular Biology and Evolution Seiten 1294-1301 Link Publikation -
2019
Titel GHOST: Recovering Historical Signal from Heterotachously Evolved Sequence Alignments DOI 10.1093/sysbio/syz051 Typ Journal Article Autor Crotty S Journal Systematic Biology Seiten 249-264 Link Publikation -
2016
Titel W-IQ-TREE: a fast online phylogenetic tool for maximum likelihood analysis DOI 10.1093/nar/gkw256 Typ Journal Article Autor Trifinopoulos J Journal Nucleic Acids Research Link Publikation -
2016
Titel Reversible polymorphism-aware phylogenetic models and their application to tree inference DOI 10.1016/j.jtbi.2016.07.042 Typ Journal Article Autor Schrempf D Journal Journal of Theoretical Biology Seiten 362-370 Link Publikation -
2016
Titel Terrace Aware Data Structure for Phylogenomic Inference from Supermatrices DOI 10.1093/sysbio/syw037 Typ Journal Article Autor Chernomor O Journal Systematic Biology Seiten 997-1008 Link Publikation -
2018
Titel MPBoot: fast phylogenetic maximum parsimony tree inference and bootstrap approximation DOI 10.1186/s12862-018-1131-3 Typ Journal Article Autor Hoang D Journal BMC Evolutionary Biology Seiten 11 Link Publikation -
2020
Titel IQ-TREE 2: New Models and Efficient Methods for Phylogenetic Inference in the Genomic Era DOI 10.1093/molbev/msaa015 Typ Journal Article Autor Minh B Journal Molecular Biology and Evolution Seiten 1530-1534 Link Publikation -
2020
Titel Distinguishing Felsenstein Zone from Farris Zone Using Neural Networks DOI 10.1093/molbev/msaa164 Typ Journal Article Autor Leuchtenberger A Journal Molecular Biology and Evolution Seiten 3632-3641 Link Publikation -
2017
Titel UFBoot2: Improving the Ultrafast Bootstrap Approximation DOI 10.1093/molbev/msx281 Typ Journal Article Autor Hoang D Journal Molecular Biology and Evolution Seiten 518-522 Link Publikation -
2017
Titel Complex Models of Sequence Evolution Require Accurate Estimators as Exemplified with the Invariable Site Plus Gamma Model DOI 10.1093/sysbio/syx092 Typ Journal Article Autor Nguyen L Journal Systematic Biology Seiten 552-558 Link Publikation -
2017
Titel ModelFinder: fast model selection for accurate phylogenetic estimates DOI 10.1038/nmeth.4285 Typ Journal Article Autor Kalyaanamoorthy S Journal Nature Methods Seiten 587-589 Link Publikation -
2017
Titel HIV-1 Full-Genome Phylogenetics of Generalized Epidemics in Sub-Saharan Africa: Impact of Missing Nucleotide Characters in Next-Generation Sequences DOI 10.1089/aid.2017.0061 Typ Journal Article Autor Ratmann O Journal AIDS Research and Human Retroviruses Seiten 1083-1098 Link Publikation -
2017
Titel Modeling Site Heterogeneity with Posterior Mean Site Frequency Profiles Accelerates Accurate Phylogenomic Estimation DOI 10.1093/sysbio/syx068 Typ Journal Article Autor Wang H Journal Systematic Biology Seiten 216-235 Link Publikation