Multivariate tests and multiple test-procedures for abundance data of microorganisms in consideration of information from phylogenetic sequences
Final Report Abstract
Im Rahmen des geförderten Projekts wurden der Zusammenhang von phylogenetischen Ähnlichkeiten (bzw. Abständen) von mikrobiellen Spezies (OTUs) und Korrelationen in der Häufigkeit ihres Auftretens (Abundanzen) in Bodenproben untersucht. Die Hoffnung bestand darin, einen deutlichen Zusammenhang zu finden und diesen zur Stabilisierung der Kovarianzschätzung in Abundanzdaten bei typischerweise kleinen Stichprobenumfängen in den ökologischen Studien auszunutzen. Damit sollten dann Modifikationen von bestehenden multivariaten Testmethoden und multiplen Testprozeduren mit höherer Güte als in den Originalvorschlägen gefunden werden. Bei den untersuchten Datensätzen aus Studien des Julius Kühn-Instituts ergab sich jedoch relativ konsistent über alle Studien und Modifikationen der Berechnungsvarianten, dass ein solcher Zusammenhang nicht im nennenswerten Umfang existiert. Damit waren die Ziele einer allgemeinen Gütesteigerung der Verfahren nicht mehr realisierbar. Stattdessen wurde nach Lösungen gesucht, diese Informationen für Modifikationen der Verfahren zu nutzen, welche eine bessere Interpretierbarkeit der Ergebnisse für den Endnutzer bewirken. Im Falle von Hauptkomponenten-basierten Tests gelang das in dem Sinne, dass die bislang genutzten Hauptkomponenten nochmals mittels kanonischer Korrelation zu den phylogenetischen Ähnlichkeitsmaßen rotiert wurden und dadurch in den ersten Hauptkomponenten eine etwas verbesserte Sichtbarkeit der Effekte der untersuchten Faktoren erreichten. Für multiple Testprozeduren mit einer Mischung aus multivariaten und univariaten Hypothesenmengen hat sich besonders die Nutzung der phylogenetischen Informationen in Form der klassischen taxonomischen Einteilung der OTUs in Graphen-basierten Prozeduren bewährt. Hierzu wurde eine verkürzte Version der Focus-Level-Methode aus der Literatur übernommen und für die vorliegende Situation noch einmal leicht vereinfacht. Die Nutzung der taxonomischen Einteilungen als Gerüst für die Auswahl der Merkmalsmengen für die Subhypothesen in der multiplen Prozedur sichert, dass gefundene multivariate Effekte auch immer in einer Anwender-orientierten Weise beschreiben werden können. Der Versuch, bisherige Ansätze für multiples Testen mit univariaten Hypothesen unter Erzeugung von datengenerierten Ordnungen der Hypothesen im Sinne einer möglichst hohen Power durch die Nutzung der Ähnlichkeitsmaße der Sequenzen weiter zu verbessern, erbrachte in den Daten keinen Vorteil, obwohl Simulationsstudien einen möglichen Effekt zeigen, wenn man stärkere Zusammenhänge zwischen Abundanzdaten und Sequenzähnlichkeiten unterstellt. Diese Verfahren sollten deshalb neu aufgriffen werden, wenn es gelingt, andere Genabschnitte für die Sequenzierung zu identifizieren, die einen stärkeren Zusammenhang mit den Abundanzwerten aufweisen. Die Ergebnisse des Projekts wurden publiziert. Sie liefern im Moment schon einen Nutzen durch die Verfahrensmodifikationen im Sinne einer besseren Interpretierbarkeit der Ergebnisse. Sie geben weiterhin eine Vorstellung davon, wie die weitere Entwicklung der Methodik in Kooperation zwischen Mikrobiologen und Biometrikern laufen könnte.
Publications
- (2015). Tests based on asymmetric modifications of multivariate distance measures. 5th Nordic-Baltic Biometric Conference, Reykjavik, June 8-10, 2015
Kropf, S., Antweiler, K.
- (2015). Äquivalenzgrenzenbestimmungsmöglichkeiten für Tests auf Gleichheit. GMDS Jahresversammlung, Krefeld, 06.09. - 09.09.2015
Antweiler, K., Kropf, S.
(See online at https://dx.doi.org/10.3205/15gmds128) - (2017). Incorporating Phylogenetic Information in Statistical Abundance Testing. 4th Microbiome R & D and Business Collaboration Forum & Probiotics Congress: Europe, Amsterdam, 03./04. April 2017
Antweiler, K., Anusic, T., Kropf, S.
- (2017). Statistical test for tolerability of effects of an antifungal biocontrol strain on fungal communities in three arable soils. Microb Biotechnol. 2017 Mar, 10(2):434-449
Antweiler, K., Schreiter, S., Keilwagen, J., Baldrian, P., Kropf, S., Smalla, K., Grosch, R., Heuer, H.
(See online at https://doi.org/10.1111/1751-7915.12595) - (2017). Using phylogenetic information for the analysis of microbial abundance data. CEN ISBS, Joint Conference on Biometrics and Biompharmaceutical Statistics, Vienna Austria, 28.08.-01.09.2017
Antweiler, K., Anusic, T., Kropf, S.