Logo der Universität Wien

Willkommen bei der Forschungsgruppe Data Mining

In zahlreichen Anwendungen, z. B. in der Biomedizin, im Web oder in Sensornetzwerken können wir eine regelrechte Datenexplosion beobachten. Wir haben beste Möglichkeiten um komplexe Fragen zu beantworten, z.B. „Wie komme ich morgen am besten zum Flughafen?“ oder „Ist dieses Medikament für mich geeignet?“ Allerdings bringen mehr Daten nicht automatisch mehr Wissen. Um das Potential von Big Data ausnutzen zu können, brauchen wir intelligente und effiziente Algorithmen, die das Wissen in Daten für uns Menschen zugänglich und verständlich machen. Die von Prof. Dr. Claudia Plant geleitete Forschungsgruppe Data Mining erforscht Informatikmethoden, um den Prozess der Wissensgewinnung aus Big Data umfassend zu unterstützen.

In unserer aktuellen Forschung stützen wir uns vor allem auf informationstheoretische Methoden. Um den Gehalt an Wissen in Daten messbar zu machen, betrachten wir Data Mining als ein Datenkompressionsproblem. Wenn Daten interessante Strukturen wie Zusammenhänge oder andere Muster enthalten, können wir diese mit einem Data Mining Verfahren finden. Wir nutzen das gewonnene Wissen über die gefundenen Muster, um die Daten kompakter zu repräsentieren. Der Kompressionsgrad ist ein sehr allgemeines Qualitätsmaß für Data Mining. Basierend auf dieser Idee verfolgen wir drei Forschungsschwerpunkte.

Generalisierung von Techniken. Es gibt nicht nur immer mehr Daten sondern auch immer mehr Data Mining Techniken. Einerseits ist das begrüßenswert und zeigt die Dynamik des Forschungsgebiets. Andererseits bedeutet diese Entwicklung für den Anwender aber auch die Qual der Wahl. Er muss aus tausenden von Möglichkeiten einen bestimmten Algorithmus auswählen. Wir erforschen daher generalisierte Ansätze, die mehrere Methoden verallgemeinern und möglichst alle Arten von Mustern finden, die in den Daten enthalten sind.

Integration von Daten. Die meisten existierenden Data Mining Techniken unterstützen nur einen bestimmten Eingabedatentyp, z.B. numerische Vektordaten, kategorische Daten oder Graphen. In den Anwendungen liegen häufig mehrere Datenquellen unterschiedlichen Typs vor, z.B. ein Graph mit zusätzlichen numerischen und kategorischen Attributen für die Knoten und Kanten. Wir erforschen Techniken, die interessante Zusammenhänge zwischen den einzelnen Datenquellen aufdecken. Besonders interessieren uns neue Arten von Mustern die erst durch die Integration der Daten sichtbar werden, z.B. Muster in Attributen, die das Verbindungsmuster im Graphen beeinflussen.

Hocheffizientes Data Mining unterstützt durch moderne Hardware. Um die Wissensgewinnung aus großen Daten zu ermöglichen, nutzen wir die Performanz moderner Hardware aus. Wir entwickeln hochparallele Data Mining Algorithmen für multi-core- und Graphikprozessoren, die die Speicherhierarchie der jeweiligen Architektur möglichst optimal ausnutzen. Außerdem entwickeln wir Indexstrukturen, die wichtige Grundbausteine unserer Algorithmen wie z.B. K-nächste Nachbarn Anfragen effektiv beschleunigen.

Unsere Vision ist die Informationsfabrik. Generalisierung und Integration erlauben die Gewinnung von interessantem Wissen aus heterogenen Daten. Wir entwickeln und evaluieren unsere neuen Methoden in interdisziplinären Projekten mit Neurowissenschaftlern, Biologen und Umweltwissenschaftlern. Wir unterrichten die Grundlagen von Data Mining anhand von praxisnahen Beispielfragestellungen. In aufbauenden Veranstaltungen diskutieren wir aktuelle Forschungsbeiträge und vergeben forschungsnahe Themen für Abschlussarbeiten.

News & Events

Prof. Claudia Plant im uni:view Portrait

Die Data-Mining Expertin Claudia Plant wird im Vorfeld zu ihrer Antrittsvorlesung am 31.3. (Thema: "Auf der Suche nach Wissen im Datenberg") vorgestellt.

16. Mär 2017
"Big Data: Sind wir bereits gläserne Menschen?"

Prof. Claudia Plants Überlegungen zur Semesterfrage "Wie leben wir in der digitalen Zukunft?" auf derstandard.at: Diskutieren Sie mit!

5. Jan 2017
"Informatik sollte Pflichtschulfach sein"

Ohne digitale Bildung verlieren wir in Österreich den Anschluss an die Automatisierungsgesellschaft. Das prognostizieren die Data Scientists Claudia Plant und ihre...

21. Dez 2016
Six contributions accepted at IEEE International Conference on Data Mining (ICDM)

The following papers have been accepted at ICDM 2016:

Generalized Independent Subspace ClusteringFactorizing Complex Discrete Data "with Finesse"Partitioning...

20. Sep 2016
Prof. Plant im uni:view-Kurzporträt

Frau Prof. Claudia Plant wurde mit 1. Jänner 2016 als Professorin für Data Mining an die Fakultät für Informatik berufen. Die Leiterin der neuen Forschungsgruppe im Kurzporträt...

20. Jan 2016
"Schatzsuche im Datenberg"

Frau Prof. Claudia Plant leitet seit 1. Jänner 2016 die Forschungsgsruppe Data Mining an der Fakultät für Informatik der Universität Wien. Die Tageszeitung Die Presse hat sie...

18. Jan 2016
Kontakt
Fakultät für Informatik
Universität Wien

Währinger Straße 29
1090 Wien