Masterprüfung mit Defensio, Johannes Elias Tüchler

01.03.2023 15:30

Biologiezentrum Universität Wien

Raum 2.001

Djerassiplatz 1

1030 Wien

01.03.2023, 15:30 Uhr
Biologiezentrum Universität Wien
Raum 2.001
Djerassiplatz 1
1030 Wien

Titel: „Acceleration of exact pairwise protein sequence alignment“

Kurzfassung
Das paarweise Alignment von Proteinsequenzen ist eine zentrale Aufgabe der Bioinformatik,
das dazu beiträgt, biologische Verwandtschaft zwischen Proteinsequenzen zu
erkennen. Alignments können mit schnellen Heuristiken oder mit dem exakten Smith-
Waterman-Algorithmus durchgeführt werden, welcher garantiert das optimale lokale
Alignment zwischen zwei Sequenzen findet. Aufgrund der quadratischen Zeitkomplexität
des Smith-Waterman-Algorithmus, sind für große Proteinvergleiche schnelle Implementierungen
erforderlich. Daher wurden für den Smith-Waterman-Algorithmus verschiedene
Parallelisierungsmethoden und Anpassungen für Hardwarebeschleuniger (GPU, FPGA,
Xeon Phi) entwickelt.
In dieser Arbeit wird die Geschwindigkeit einiger der schnellsten Smith-Waterman-
Methoden für CPU und GPU unter verschiedenen Parametereinstellungen verglichen.
Das zentrale Ergebnis ist, dass die schnellste CPU-Methode SWIPE die schnellste GPUMethode
CUDASW++ 3 auf einem vollen Rechenknoten mit 24 CPU-Kernen und 6 GPUs
übertrifft.
Im SIMAP-Projekt (Similarity Matrix of Proteins) werden Ähnlichkeiten zwischen Proteinen
kompletter Genome mit Hilfe des Smith-Waterman-Algorithmus mit compositional
score adjustment berechnet. Aufgrund der hohen Laufzeit des SIMAP-Workflows, werden
in dieser Arbeit Möglichkeiten zur Verringerung der Laufzeit untersucht. Durch die Erstellung
eines Laufzeitprofils für den SIMAP-Workflow wurde eine ineffiziente Kompilierung
eines Skripts festgestellt und nach Optimierung des Kompilierungsprozesses konnte die
Laufzeit auf etwa ein Drittel reduziert werden.
 

Organiser:

SPL 5

Location:
Biologiezentrum Universität Wien