Masterprüfung mit Defensio, Sorer Lukas

16.12.2024 16:00 - 17:30

Universität Wien

Besprechungsraum 4.34, hybrid

Währinger Str. 29

1090 Wien

16.12.2024, 16:00 Uhr

Universität Wien
Besprechungsraum 4.34, hybrid
Währinger Str. 29
1090 Wien

Titel: Data Quality Challenges of Event Logs for Process Mining

Kurzfassung:
Diese Masterarbeit untersucht die zentrale Rolle der Datenqualität im Process Mining
und fokussiert sich auf die Identifizierung und Bewertung von Qualitätsproblemen in
Ereignisprotokollen. Da Process Mining zunehmend an Bedeutung für die Analyse von
Geschäftsprozessen gewinnt, ist die Qualität der zugrunde liegenden Ereignisprotokolle
entscheidend, um verlässliche und umsetzbare Erkenntnisse zu gewährleisten. Durch eine
umfassende Literaturrecherche wird bestehendes Wissen über allgemeine und speziell für
das Process Mining relevante Datenqualitätsdimensionen zusammengefasst. Aufbauend
auf grundlegenden Modellen und Definitionen der Datenqualitätsforschung werden zentrale
Dimensionen für Ereignisdaten identifiziert, darunter Vollständigkeit, Genauigkeit,
Validität, Interpretierbarkeit und Relevanz. Diese Dimensionen bilden die Grundlage für
ein neuartiges Data Quality Assessment Framework (DQAF), das entwickelt wurde, um
spezifische Qualitätsprobleme in Ereignisprotokollen zu erkennen und zu bewerten. Das
DQAF umfasst systematische Indikatoren und Bewertungsmaße für jede Dimension und
ermöglicht so eine strukturierte Evaluierung der Datenqualität im Kontext des Process
Mining.
Zur praktischen Implementierung dieses Frameworks wurde das Event Data Quality
Dashboard (EDQD) als diagnostisches Tool für die Datenqualitätsanalyse entwickelt. Das
EDQD visualisiert Datenqualitätsbewertungen und liefert Prozessanalysten Einblicke in
potenzielle Mängel in Ereignisprotokollen, die die Ergebnisse des Process Mining verfälschen
könnten. Die Evaluierung des EDQD umfasste drei Arten von Ereignisprotokollen:
synthetische Datensätze, die speziell zur Isolierung bestimmter Datenqualitätsprobleme
entwickelt wurden, öffentlich verfügbare Ereignisprotokolle der Business Process Intelligence
Challenge sowie reale Datensätze eines österreichischen IT-Dienstleisters. Diese
Evaluierungen zeigten die Fähigkeit des EDQD, eine Vielzahl von Datenqualitätsproblemen
über verschiedene Protokollstrukturen und Domänen hinweg zu identifizieren, was
die Robustheit des Frameworks und die praktische Anwendbarkeit des Tools in realen
Umgebungen bestätigte.
Die Ergebnisse zeigen, dass das EDQD, das auf einem strukturierten Bewertungsframework
basiert, Prozessanalysten effektiv dabei unterstützen kann, Datenqualitätsprobleme
in Ereignisprotokollen zu diagnostizieren und zu erkennen. Durch die Anwendung des
Tools auf verschiedene Datentypen verdeutlicht diese Arbeit die Bedeutung einer rigorosen
Datenqualitätsbewertung für verlässliche und präzise Ergebnisse im Process Mining.

Organiser:

SPL 5

Location:

Besprechungsraum 4.34

Währinger Straße 29
1090 Wien