18.12.2024, 15:00 Uhr
Universität Wien
Besprechungsraum 5.35
Währinger Str. 29
1090 Wien
Titel: Deriving FactSets from Unstructured Text using Named-Entity
Linking and Linked Data
Kurzfassung:
Die exponentiell ansteigende Menge an unstrukturierten Daten im Internet hat zu einer
signifikanten Zunahme der Nachfrage nach Tools geführt, welche diese Daten automatisch
strukturieren und auf Fakten überprüfen können. Im Rahmen dieser Arbeit wird ein
innovativer Ansatz zur Strukturierung von unstrukturierten Daten sowie deren Überprüfung
auf Fakten präsentiert, welcher durch eine Kombination von Natural Language Processing
und Knowledge Graphs realisiert wird. Der hier vorgestellte Ansatz basiert auf der
Verwendung von Methoden der Named Entity Recognition und Entity Linking, um
Entitäten in Texten zu identifizieren und mit einem Knowledge Graphen zu verknüpfen.
Dies erlaubt die Extraktion zusätzlicher Informationen sowie die Erstellung eines FactSets,
welches durch FactCheck zur Faktenüberprüfung der Daten verwendet werden kann. Der
vorgeschlagene Ansatz wird anhand eines Testdatensatzes von Nachrichtenartikeln evaluiert
und zeigt vielversprechende Ergebnisse in Bezug auf Genauigkeit und Effizienz. Die
Ergebnisse dieser Arbeit haben Auswirkungen auf ein breites Spektrum von Anwendungen,
einschließlich Information Retrieval, Datenintegration und Knowledge Discovery.