06.10.2025, 10:00 Uhr
Universität Wien
Besprechungsraum 4.34
Währinger Str. 29
1090 Wien
Titel: Tracing the Evolutionary History of Tartary Buckwheat: A
Genomic Approach to Investigating Its Domestication and
Diversification
Kurzfassung:
Ziel dieser Arbeit war es, genomische Regionen und Gene zu identifizieren, die mit
der Domestikation von Tatarischem Buchweizen (Fagopyrum tataricum) in Zusammenhang
stehen. Dazu wurde ein Machine-Learning (ML) Ansatz auf Basis des
Random Forest (RF) Algorithmus mit klassischen populationsgenetischen Methoden
und funktionellen Annotationsverfahren kombiniert, um domestikationsbedingte
genetische Unterschiede m¨oglichst zuverl¨assig von solchen zu unterscheiden,
die durch Gendrift oder Umweltanpassung entstanden sein k¨onnten. Die Analyse
basierte auf ¨offentlich verf¨ugbaren Sequenzdatens¨atzen von wilden und kultivierten
Buchweizen-Proben. Nach umfassender Qualit¨atskontrolle wurde die Populationsstruktur
mittels Hauptkomponentenanalyse (PCA) und Admixture untersucht.
Dabei konnte neben den bekannten Wild- und Landsorten erstmals eine bislang
unbeschriebene Substruktur innerhalb nordchinesischer Landsorten (NLI) identifiziert
werden. Zur Identifikation potenzieller Domestikationsgene wurde ein RF
Modell auf Proben trainiert, die mindestens 90% einem klar definierten genetischen
Cluster zugeordnet waren. Es wurden drei genomische Hotspot-Regionen mit Kandidatengenen
identifiziert. Die Gene wurden zus¨atzlich funktionell annotiert und
mit bekannten Domestikationsloci aus der Literatur verglichen, um ihre potenzielle
Rolle im Domestikationsprozess besser einzuordnen. Eine Gene-Ontology-Analyse
zeigte eine signifikante Anreicherung von Kategorien wie Fetts¨auremetabolismus,
Transkriptionsregulation und Stressantwort – Prozesse, die h¨aufig mit Pflanzendomestikation
in Verbindung stehen. F¨ur ausgew¨ahlte Kandidatengene wurden
SNP-Heatmaps erstellt, um Allelfrequenzverschiebungen zwischenWild- und Kulturformen
visuell darzustellen. Erg¨anzend wurden mit SnpEff potenzielle funktionelle
Effekte einzelner SNPs vorhergesagt, um Hinweise auf domestikationsrelevante
Selektionssignale weiter zu untermauern. Besonders hervorzuheben ist
FtPinG0000278400.01, das f¨ur ein COPII-Vesikel-Assemblierungsprotein (Sec16)
codiert und bereits mit einem buchweizenspezifischen Domestikationsmerkmal in
Verbindung gebracht wurde. Es zeigte hohe Relevanzwerte im RF Modell, klare
Allelunterschiede sowie mehrere Mutationen mit moderater Wirkung – alles Hinweise
auf eine m¨ogliche Rolle im Domestikationsprozess. Die Arbeit zeigt, wie die
Kombination von ML und klassischen bioinformatischen Ans¨atze genutzt werden
kann, um pflanzliche Domestikations- und Diversifikationsprozesse auf genomischer
Ebene zu analysieren. Neben neuen Erkenntnissen zur Populationsstruktur
konnten bislang unerforschte Kandidatengene identifiziert werden.
