Populationsgenetische Methoden zum Nachweis evolutionärer Anpassung in Populationen mit komplexer demographischer Struktur
Final Report Abstract
Evolutionäre Anpassungsprozesse infolge natürlicher Selektion hinterlassen ihre Spuren im Genom. Sucht man in populationsgenetischen Daten nach Genen, die Spuren von Selektion zeigen, muss man berücksichtigen, welche Signale auf die Demographie der Populationen zurückzuführen sind, also etwa auf Änderungen von Populationsgrößen, auf Genfluss zwischen Populationen oder darauf, dass zwei Populationen durch Teilung einer Urpopulation entstanden sind. Dazu muss man zunächst die Demographie untersuchen. Wir haben eine neue statistisch-bioinformatische Methode, Jaatha, entwickelt, um aus neutralen Gen-Loci, also solchen, die seit längerem nicht an evolutionären Anpassungsprozessen beteiligt waren, die Demographie von verwandten Populationen zu rekonstruieren. Wir haben uns dabei an einem biologischen Modellsystem aus zwei nah verwandten Arten von Wildtomaten, Solanum peruvianum und Solanum chilense, orientiert. Ein besonderer Aspekt der Demographie ist hierbei die Aufspaltung der beiden Arten, und von besonderem biologischen Interesse sind Gene, die im Zuge der Artbildung unter Selektion standen. Oft vernachlässigt man in der Populationsgenetik, dass eine DNA-Position mehrfach von Mutationen getroffen werden kann. Schon für einen relativ kleinen Datensatz, der uns für die beiden Tomatenarten zu Beginn des Projekts zur Verfügung stand, haben wir jedoch festgestellt, dass diese Annahme zu einer deutlichen Verfälschung der Schätzungen demographischer Parameter führen kann. Jaatha kann daher Doppel- und Rückmutationen berücksichtigen. Ein interessantes Ergebnis unserer ersten Analysen war, dass die Daten signifikante Hinweise auf fortdauernden Genfluss zwischen den Arten zeigen, obwohl sich die beiden Arten im Gewächshaus nie kreuzen ließen. Um die Demographie der Tomatenarten noch genauer rekonstruieren zu können, und um genomweit nach Genen unter Einfluss von Selektion zu suchen, haben wir mit weiteren Proben aus den beiden Arten mittels Transkriptomsequenzierung (RNA-Seq) einen großen Datensatz erstellt. Parallel dazu haben wir Jaatha so erweitert, dass es für genomeweite Daten anwendbar ist und auch die wesentlichen Besonderheiten von Transkriptomdaten berücksichtigen kann. Die Analysen der Daten sind noch nicht abgeschlossen. Erste spannende Ergebnisse liegen aber bereits vor. So wurden unter den sequenzierten Pflanzen tatsächlich Hybride gefunden, was klar bestätigt, dass es Introgression, also Genfluss, zwischen den Arten gibt. Der Ansatz, die Demographie zunächst aus neutralen Gen-Loci zu rekonstruieren, kann bei genomweiten Daten problematisch sein, da man sich über die Neutralität der Loci nie ganz sicher sein kann. Daher haben wir auch eine Variante von Jaatha entwickelt, die bei der Demographie-schätzung erlaubt, dass ein Anteil der verwendeten Loci von Selektion betroffen ist und diesen Anteil zusammen mit den demographischen Parametern schätzt. Eine Implementation unserer Methode Jaatha stellen wir als Software-Paket für die freie Statistiksoftware R zur Verfügung. Jaatha basiert auf einem Composite-Likelihood-Ansatz. Für Jaatha benötigten wir neue Methoden, um populationsgenetische Daten für größere genomische Abschnitte effizient simulieren zu können sowie neue Statistiken, mit denen aus solchen Datensätzen relevante Informationen extrahiert werden können. Da beides auch für andere methodische Ansätze als Jaatha nützlich ist, stellen wir die entsprechenden Programme als separate R-Pakete Scrm und Coala zur Verfügung. Unsere R-Pakete sind über die offiziellen CRAN-Server des R-Projekts frei erhältlich.
Publications
- (2011): Estimating parameters of speciation models based on refined summaries of the joint site-frequency spectrum. PLoS One 6(5): e18155
Tellier, A., P. Pfaffelhuber, B. Haubold, L. Naduvilezhath, L. E. Rose, T. Städler, W. Stephan, and D. Metzler
(See online at https://doi.org/10.1371/journal.pone.0018155) - (2011): Jaatha: a fast composite-likelihood approach to estimate demographic parameters. Molecular Ecology 20(13):2709-23
Naduvilezhath, L., L. E. Rose, D. Metzler
(See online at https://doi.org/10.1111/j.1365-294X.2011.05131.x) - (2012): Selective Sweeps in Multilocus Models of Quantitative Traits. Genetics 192(1) 225-239
Pavlidis, P. D. Metzler, W. Stephan
(See online at https://doi.org/10.1534/genetics.112.142547) - (2013): Competing islands limit the rate of adaptation in structured populations.Theoretical Population Biology 90: 1-11
Pokalyuk, C., L. Mathew, D. Metzler, P. Pfaffelhuber
(See online at https://doi.org/10.1016/j.tpb.2013.08.001) - (2013): The role of biogeography in shaping diversity of the intestinal microbiota in house mice. Molecular Ecology 22(7):1904-1916
Linnenbrink, M., J. Wang, E. Hardouin, S. Künzel, D. Metzler, J. Baines
(See online at https://doi.org/10.1111/mec.12206) - (2013): Why to account for finite-sites in population genetic studies and how to do this with Jaatha 2.0. Ecology and Evolution 3: 3647–3662
Mathew, L., L. E. Rose, P. Staab, D. Metzler
(See online at https://doi.org/10.1002/ece3.722) - (2015): Evolutionarily dynamic, but robust, targeting of resistance genes by the miR482/2118 gene family in the Solanaceae. GBE 7:3307–3321
de Vries, S. T. Kloesges, L. Rose
(See online at https://doi.org/10.1093/gbe/evv225) - (2015): scrm: efficiently simulating long sequences using the approximated coalescent with recombination. Bioinformatics
Staab, P. S. Zhu, D. Metzler, and G. Lunter
(See online at https://doi.org/10.1093/bioinformatics/btu861) - (2016) coala: An R framework for coalescent simulation. Bioinformatics
Staab P., D. Metzler
(See online at https://doi.org/10.1093/bioinformatics/btw098)