Masterprüfung mit Defensio, Fritz Florian

21.06.2018 15:00 - 16:30

Universität Wien

Besprechungsraum 4.34

Währinger Straße 29

1090 Wien

21.06.2018, 15:00 Uhr

Universität Wien
Besprechungsraum 4.34
Währinger Straße 29
1090 Wien

Titel: „Design and Development of a BANG-File Clustering System“

Kurzfassung:
Die Clusteranalyse spielt eine zentrale Rolle in der explorativen Datenanalyse. Das Balanced And Nested Grid (BANG) File ist ein hierarchisches Clustering-Verfahren des Typs Grid-File. Um riesige Datenmengen effektiv zu clustern bildet das BANG File eine mehrdimensionale Raster-Struktur, welche Daten gruppiert. Der Datenraum wird dabei durch kontinuierliches zweiteilen, orthogonal zu einer der Dimensionen, in Regionen gegliedert. Diese Regionen werden in einem Verzeichnis indexiert, welches die Eigenschaften eines balancierten Baums bietet. Anders als bisherige Grid-File Designs wächst dieses Verzeichnis dadurch proportional zu den Daten, unabhängig von der Verteilung der Daten. Die hierarchische Partitionierungsstrategie spiegelt Cluster im Datenraum wider, wobei Regionen mit den höchsten Dichten an Daten als Zentrum eines Clusters identifiziert werden. Diese Arbeit demonstriert das BANG File Clustering-Verfahren innerhalb einer eigenständigen Java Anwendung und auch als ein WEKA Plugin.

Organiser:

SPL 5

Location:

Besprechungsraum 4.34

Währinger Straße 29
1090 Wien