Masterprüfung mit Defensio, Holzmüller Julian

24.09.2019 11:00 - 12:30

Universität Wien

Besprechungsraum 6.35

Währinger Straße 29

1090 Wien

24.09.2019, 11:00 Uhr

Universität Wien
Besprechungsraum 6.35
Währinger Straße 29
1090 Wien

Titel: „Parallelizing the computation of magnetic fields from a uniformly magnetized polyhedron on various single devices“

Kurzfassung:
Die vorliegende Masterarbeit beschäftigt sich mit der Berechnung von Feldpunkten eines Magnetfeldes resultierend aus einer Menge an gleichmäßig magnetisierten willkürlichen Polyeder. Solch Polyeder lassen sich beispielsweise in Permanentmagneten finden. Die Anzahl der berechneten Feldpunkte sowie die Quantität der Polyeder sind variabel und können je nach Anwendungsfall beliebig nach oben skaliert werden. Dadurch können sich große Datenmengen ergeben. Um diese Datenmengen performant Verarbeiten zu können, werden individuell alleinstehende heterogene Hardwaregeräte mit einem hohen Grad an Parallelität verwendet. Zu diesen Hardwaregeräten zählen etwa Multi- und Many-core Prozessoren sowie Hardwarebeschleuniger wie Grafi kkarten (GPUs) oder Many Integrated Core Architekturen (MICs). Durch die Palette an unterschiedlichen Hardwarearchitekturen kann anhand eines Vergleichs der jeweiligen Performance das für den Algorithmus beste Gerät gefunden werden. Als Faktoren für die Performance werden Laufzeit sowie der gemessene Energieverbrauch herangezogen. Eine für den Algorithmus optimierte Datenstruktur wurde entwickelt und der resultierende Unterschied zu einer naiven Herangehensweise aufgezeigt. Diese Datenstruktur ist die Basis für das Erreichen einer größtmöglichen Auslastung der Geräte. Zusätzlich wurden für jede Implementierung auf die zur Grunde liegende Hardwarearchitektur Optimierungen ausgearbeitet und angewandt. Die Analyse der Performancemessungen zeigte, dass für den verwendeten datenintensiven Algorithmus eine Kombination aus schnellen, möglichst lokalen Speicherzugriff en und einem hohen Maß an verwendeten Threads einer kleineren Anzahl von Threads, ausgeführt auf stärkeren Rechenkernen vorzuziehen ist. Wobei die optimale Vektorisierung der Berechnungen großen Einfluss auf die Performance hat und somit forciert werden muss.

Organiser:

SPL 5

Location:

Besprechungsraum 6.35

Währinger Straße 29
1090 Wien