Best Paper Award

Bei der DBKDA Konferenz

Bei der “Tenth International Conference on Advances in Databases, Knowledge, and Data Applications” 2018 in Nizza wurde das Paper “QuaIIe: A Data Quality Assessment Tool for Integrated Information Systems” mit dem Best Paper Award ausgezeichnet.



Wissen über die Qualität von Daten ist eine wichtige Voraussetzung für die Bewertung von Analyseergebnissen und daraus abgeleitete Entscheidungen, die auf diesen Daten basieren. Das in dem Paper vorgestellte Tool “QuaIIe” ermöglicht eine automatisierte Ersteinschätzung der Qualität von Datenquellen, was insbesondere bei großen Datenmengen, oder wenn kein Domänenexperte vorhanden ist, von großer Bedeutung ist. QuaIIe implementiert Datenqualitätsmetriken für Vollständigkeit, Korrektheit, Pertinenz, Minimalität, Lesbarkeit und Normalisierung sowohl für die Daten selbst als auch zur Bewertung der Datenschemata. Der Fokus bei der Entwicklung wurde auf ein möglichst generisch gehaltenes Framework gelegt, welches eine einfache Erweiterung für zusätzliche Datenbankanbindungen (derzeit MySQL, CSV, Oracle, Cassandra), Datenqualitätsmetriken sowie Exportfunktionen für die Bewertungsergebnisse bereitstellt.

Forschungskooperation

Die Arbeit entstand im Rahmen der Dissertation von DI Lisa Ehrlinger, die sich inhaltlich mit der automatisierten Überwachung der Datenqualität in Informationssystemen beschäftigt. Betreut wird die Dissertation von a.Univ.-Prof. Dr. Wolfram Wöß vom Institut für Anwendungsorientierte Wissensverarbeitung (FAW) der JKU.

Am Software Competence Center Hagenberg forscht Lisa Ehrlinger im Data Analysis Team an der Imputation fehlender Werte (Projekt daSEM in Kooperation mit voestalpine Stahl GmbH) und an einer Python-Library für Datenqualitätsüberwachung (Projekt moFocs in Kooperation mit Siemens AG). Weiters ist sie für den Zugriff und die verteilte Speicherung von chemometrischen Daten in einer Cassandra DB zuständig (Projekt imPACts mit Metadynea).

Mehr Infromationen finden Sie hier:

zurück