Datenqualität in der Wissenschaft sichern

Die Qualität von Forschungsdaten ist eine Grundlage guter Wissenschaft. In seinem aktuellen Empfehlungspapier widmet sich der Rat für Informationsinfrastrukturen (RfII) nun der „Herausforderung Datenqualität“.

Herausforderungen für die Datenqualität im Datenlebenszyklus in (selbst-)kritischer Sicht.

Herausforderungen für die Datenqualität im Datenlebenszyklus in (selbst-)kritischer Sicht.

RfII – Rat für Informationsinfrastrukturen: Herausforderung Datenqualität – Empfehlungen zur Zukunftsfähigkeit von Forschung im digitalen Wandel, Göttingen 2019, S. 31.

Legende
Innenkreis: Datenlebenszyklus, mittlerer Kreis: Probleme und Faktoren für Datenqualität entlang des Datenlebenszyklus, Außenkreis: potentiell hinderliche Rahmenbedingungen der Wissenschaft

Abkürzungen
LZA – Langzeitarchivierung; QM – Qualitätsmanagement

Diskussionen um steigende Datenmengen in der digitalen Zeit machen auch vor der Wissenschaft nicht halt. Durch neue Methoden und Verfahren stellt die Erzeugung und Verarbeitung von Daten mittlerweile in nahezu allen Disziplinen einen essenziellen Bestandteil der Forschungsleistung dar. Die entstehenden Forschungsdaten sind somit die Basis für neue Erkenntnisse. Entsprechend wichtig ist die Sicherung der Datenqualität. In der wissenschaftlichen Praxis steht die Qualitätssicherung von Forschungsdaten jedoch vor vielfältigen Herausforderungen. Der Rat für Informationsinfrastrukturen (RfII) richtet in dem Positionspapier „Herausforderung Datenqualität – Empfehlungen zur Zukunftsfähigkeit von Forschung im digitalen Wandel“ einen Blick auf den aktuellen Umgang mit Forschungsdaten und gibt Empfehlungen zur Weiterentwicklung der Datenqualität.

Herausforderungen für die Datenqualität

Die Qualität von Daten zeichnet sich in der Wissenschaft unter anderem durch Transparenz und Nachvollziehbarkeit der Datensätze aus. Entsprechend der FAIR-Prinzipien sollten die Daten auffindbar (findable), zugänglich (accessible), interoperabel (interoperable) und wiederverwendbar (reusable) sein. Für die (Nach-)Nutzung von Forschungsdaten ist es wichtig, dass sie nicht nur methodisch korrekt erhoben, sondern auch gut dokumentiert vorliegen. Nur so ergeben sich im wissenschaftlichen Arbeiten valide Ergebnisse, die möglichst replizierbar sind. Diese Anforderungen bringen für die Qualitätssicherung in der Forschung jedoch einige Herausforderungen mit sich.

Gerade im digitalen Wandel fallen in der Forschungsarbeit nicht nur rasant wachsende Datenmengen an, die kuratiert und gesichert werden müssen, sondern auch neue Methoden, die neue Arten der Datenerhebung mit sich bringen. Hinzu kommt ein rascher Wandel von Programmiersprachen und Software. Daten liegen also in sehr heterogenen Formen vor und können allein durch Änderungen der Aufnahmebedingungen variieren. Um die Datenqualität sicherzustellen und eine interdisziplinäre Nachnutzung zu gewährleisten, ist eine angemessene Dokumentation von Forschungsdaten notwendig. Hierzu gehören neben der Ausweisung der Erhebungsbedingungen auch die Darstellung der Veränderungen und Transformationen im Nutzungsprozess. Die Qualitätssicherung der Daten sollte auch in den weiteren Phasen des Datenlebenszyklus (von ihrer Erhebung über die Verarbeitung bis zur Weitergabe und Publikation) mitgedacht werden. Methodische Standards sollten hierbei von den Fachgemeinschaften entwickelt werden, wie es beispielsweise in der Nationalen Forschungsdateninfrastruktur verfolgt wird.

Mehr Aufmerksamkeit und Anerkennung

Ein zentraler Aspekt im Positionspapier des RfII ist die Steigerung der Aufmerksamkeit und Anerkennung für Arbeiten zur Qualitätssicherung von Forschungsdaten. Der Leistungs- und Zeitdruck unter Wissenschaftlerinnen und Wissenschaftlern rückt den qualitätsgesicherten Umgang mit Forschungsdaten oft in den Hintergrund. Die Sicherung der Datenqualität sollte jedoch als Kernaufgabe und als Grundwert der Guten Wissenschaftlichen Praxis (GWP) verstanden werden. Das Themenfeld Forschungsdaten sollte deshalb laut RfII bereits entsprechend stärker in die Lehre und Methodenausbildung verankert werden. Als Querschnittsthema berührt es alle Disziplinen und Fachbereiche. Um die Arbeiten der Forschenden zu einer guten Datengrundlage zu würdigen, sei beispielsweise bei der Bewertung von Forschungsleistungen die Prämisse Qualität statt Quantität konsequent zu verfolgen.

In seinem Positionspapier stellt der RfII eine umfangreiche Analyse der Qualitätssicherung im Wissenschaftssystem vor (vgl. Abbildung oben) und illustriert zugleich die Dringlichkeit, in diesem Feld aktiv zu werden.