Masterprüfung mit Defensio, Angelika Kapeller

06.05.2026 15:00 - 16:00

Universität Wien

Besprechungsraum 5.35

Währinger Str. 29

1090 Wien

06.05.2026, 15:00 Uhr

Universität Wien
Besprechungsraum 5.35
Währinger Str. 29
1090 Wien

Titel: Extracting facts from news videos. An approach to structuring
information for automated fact-checking.

Kurzfassung:
Nachrichtenvideos sind eine wichtige Informationsquelle. Ihre schnelle Verbreitung über
digitale Plattformen birgt jedoch das Risiko, Fehlinformationen zu verbreiten, und erfordert
daher zuverlässige Methoden automatisierter Faktenchecks. Im Unterschied zu
textbasierten Nachrichten vereinen Videos gesprochene Sprache, visuelle Elemente und
Metadaten, was eine automatische Analyse erschwert. Diese Masterarbeit präsentiert
einen Ansatz zur Extraktion strukturierter Fakten aus Nachrichtenvideos, die in weiterer
Folge von Faktencheck-Anwendungen verarbeitet werden können.
Die Arbeit gibt einen Überblick über den Stand der Forschung im Bereich des automatisierten
Faktencheckens sowie der Extraktion von Informationen. Ein besonderer Fokus
liegt dabei auf videobasierten Ansätzen. Der entwickelte Prototyp integriert verschiedene
Technologien, darunter den Microsoft Azure Video Indexer zur Analyse von Video- und
Audiodaten sowie Methoden der natürlichen Sprachverarbeitung wie Named Entity Recognition
und extraktive Textzusammenfassung. Das Ergebnis der Arbeit ist eine Pipeline
zur Extraktion von Fakten, die Personen, Organisationen und Ereignisse erkennt und
verknüpfte Informationen anhand eines Schemas, basierend auf dem schema.org-Standard,
strukturiert.
Im Zuge dieser Masterarbeit wurde ein Prototyp implementiert, der das Hochladen von
Nachrichtenvideos, deren Verarbeitung sowie die Generierung strukturierter Faktenberichte
in maschinenlesbarem Format unterstützt. Die Implementierung kombiniert cloudbasierte
und lokale NLP-Komponenten, um eine robuste Extraktion der Fakten zu gewährleisten.
Für die Evaluation des Prototyps wurden 31 Nachrichtenvideos des Senders BBC
analysiert. Anhand der Ergebnisse konnte festgestellt werden, dass Fakten zu Personen
und Ereignissen zuverlässig extrahiert und strukturiert werden. Organisationen wurden
vom Prototyp jedoch deutlich schlechter erkannt. Häufige Fehlerquellen konnten
bei der Schreibweise von Namen, bei zu unspezifischen oder zu allgemein formulierten
Informationen sowie bei unpräzisen Zeitangaben festgestellt werden.
Diese Masterarbeit präsentiert einen Ansatz zur automatisierten Extraktion von Fakten
aus Nachrichtenvideos. Die Ergebnisse der Evaluierung des Prototyps verdeutlichen, in
welchen Bereichen Verbesserungsbedarf besteht. Diese beziehen sich vor allem auf die
Verarbeitung von Organisationen, die korrekte Extraktion von Informationseinheiten
sowie von Zeitdaten. In Zukunft könnte der Fokus auf der Implementierung zusätzlicher
Entitätstypen, der optimierten Validierung extrahierter Werte sowie der Integration
weiterer Sprachen und Nachrichtenquellen liegen.

Organiser:

SPL 5

Location:

Besprechungsraum 5.35

Währinger Straße 29
1090 Wien