Vorstellung: 12 Förderprojekte zu Kurationskriterien und Qualitätsstandards von Forschungsdaten

Das Bundesforschungsministerium fördert 12 Forschungsprojekte zu Kurationskriterien und Qualitätsstandards von Forschungsdaten. Ziel ist es, eine leichtere Nachnutzung und Verwendung von Forschungsdaten in den Wissenschaftsdisziplinen zu ermöglichen.

Projekt KONTAKT

Netzwerk Teilchenwelt/Juliana Socher

Vor dem Hintergrund der Digitalisierung in der Wissenschaft fördert das Bundesforschungsministerium im Rahmen der Bekanntmachung „Entwicklung und Erprobung von Kurationskriterien und Qualitätsstandards von Forschungsdaten im Zuge des digitalen Wandels im deutschen Wissenschaftssystem 12 Forschungsprojekte. So sollen Forschungsdaten für eine interdisziplinäre Nachnutzung, aber auch in Bezug auf nichtwissenschaftliche Dimensionen wie wirtschaftliche Verwertung, gesamtgesellschaftliche Bedarfe oder eine kulturelle Bedeutung hin kuratiert und qualitätsgesichert werden. Die Projekte der 43 Partner aus Hochschulen und außeruniversitären Forschungseinrichtungen waren in der Förderbekanntmachung erfolgreich und werden nun in dem Aufbau und der Erprobung von Standards unterstützt.

 

Die 12 Projekte im Überblick:

Domain-Data-Protokolle für die empirische Bildungsforschung (DDP-Bildung)

Verbundvorhaben: GESIS – Leibniz-Institut für Sozialwissenschaften, Deutsches Jugendinstitut (DJI), Universität Bremen, Institut zur Qualitätsentwicklung im Bildungswesen (IQB), Institut für Forschungsinformation und Qualitätssicherung (DZHW), Deutsches Institut für Entwicklungspolitik (DIE), Forschungsstelle für Bildungsökonomie (LlfBi), Deutsche Institut für Wirtschaftsforschung  (DIW), Leibniz-Institut für Astrophysik Potsdam, Bibliothek für Bildungsgeschichtliche Forschung (DIPF), Universität Potsdam, Leibniz-Zentrum für Psychologische Information und Dokumentation (ZPID)

Variierende Vorgehensweisen im Datenmanagement behindern eine breite Nachnutzung von Forschungsdaten durch Dritte. Forschende sind deshalb angehalten diese Prozesse möglichst transparent zu gestalten, um eine Reproduzierbarkeit und bestenfalls Nachnutzbarkeit der Daten zu gewährleisten. Das Verbundprojekt DDP-Bildung zielt darauf ab, Domain-Data-Protokolle (DDPs), d. h. Muster-Standardprotokolle für den Umgang mit Forschungsdaten der empirischen Bildungsforschung zu entwickeln. Anhand der DDPs sollen qualitätsgesicherte und nachnutzbare Daten produziert werden. Dafür werden die Protokolle auf die spezifischen Bedingungen der Erhebungsmethoden in der Bildungsforschung unter Berücksichtigung der jeweiligen Forschungsprozesse ausgerichtet. Darüber hinaus werden anhand der entwickelten DDPs Richtwerte zur Kostenschätzung für die Kuration von Forschungsdaten in Abhängigkeit von Art und Größe der Erhebung bzw. des Forschungsprojekts ermittelt. Das Projekt leistet einen wichtigen Beitrag zur Harmonisierung und Qualitätssicherung sowie Kuratierung von Forschungsdaten in der empirischen Bildungsforschung.


Atmosphären-Modelldaten: Datenqualität, Kurationskriterien und DOI-Branding (AtMoDat)

Verbundvorhaben: Deutsches Klimarechenzentrum (DKRZ), Technische Informationsbibliothek (TIB), Universität Hamburg, Universität Leipzig

Bisher finden in der Meteorologie und Klimaforschung etablierte Standards für die Qualität, Organisation und Verwaltung von Daten primär in großen, international koordinierten Modellvergleichsstudien ihre Anwendung. Im Projekt “Atmosphären Modelldaten: Datenqualität, Kurationskriterien und DOI Branding”, kurz AtMoDat, werden diese Standards systematisch an die Bedarfe kleinerer Fachcommunities und Klima-Modellvergleichsstudien angepasst, da hier eine volle Übernahme oftmals nicht sinnvoll erscheint und zu aufwändig ist. Als Anwendungsfälle dienen unter anderem die Stadtklimaforschung mit ihren sehr hochauflösenden Daten, z. B. für Niederschlagsmenge und Windgeschwindigkeit, und kleine Klimamodellvergleichsstudien, in welchen die Standardisierung neuer Diagnostiken erprobt wird. Im Verlauf des Projekts werden diese Standards nach und nach adaptiert, auf weitere bereits existierende Atmosphärenmodelldaten angewandt und auf ihre universelle Nutzbarkeit hin evaluiert. Durch eine nachhaltige Anwendung dieser Standards, der angebundenen Prozesse zur Kuratierung und Qualitätssicherung sowie durch die Vergabe dauerhafter fachspezifischer Bezeichner wird die Nachnutzbarkeit der Atmosphärenmodelldaten für zukünftige Vergleichsstudien signifikant erhöht.


Qualitätssicherung und Vernetzung von Forschungsdaten in der Plasmatechnologie (QPTDat)

Verbundvorhaben: Leibniz-Institut für Plasmaforschung und Technologie Greifswald (INP), Leibniz-Institut für Informationsinfrastruktur Karlsruhe (FIZ), Hochschule für Angewandte Wissenschaften Hamburg (HAW)

Das Vorhaben „Qualitätssicherung und Vernetzung von Forschungsdaten in der Plasmatechnologie – QPTDat“ hat das Ziel, eine qualitätsgesicherte und interdisziplinäre Nachnutzung von Forschungsdaten der Plasmatechnologie zu ermöglichen. Zu diesem Zweck sollen Prozesse und Standards entwickelt werden, durch welche die Forschungsdaten und deren Metadaten im Sinne der FAIR-Prinzipien auffindbar (Findable), zugänglich (Accessible), interoperabel (Interoperable) und nachnutzbar (Reusable) werden. Ferner sollen Konzepte für eine automatisierte Qualitätsprüfung der Daten auf Basis eines Blockchain-Protokolls entwickelt werden. Die Daten und Metadaten der Plasmatechnologie sollen schließlich mittels eines Wissensgraphen vernetzt und auch in angrenzende Fachbereiche eingebettet werden. Dabei soll die gesamte Fachcommunity kollaborativ miteinbezogen werden.


Kuration und Qualitätssicherung von Geodaten in der Umweltforschung am Beispiel globaler Landnutzungsdaten (GeoKur)

Verbundvorhaben: Technische Universität Dresden, Universität Leipzig, Helmholtz-Zentrum für Umweltforschung (UFZ)

Das Projekt „GeoKur“ hat sich zum Ziel gesetzt, Ansätze zur Kuratierung und Qualitätssicherung von Geodaten für die Umweltforschung zu konsolidieren und weiterzuentwickeln. Am Beispiel globaler Landnutzungsdatensätze wird gezeigt, wie sich diese Ansätze im laufenden Forschungsprozess und nicht erst bei der abschließenden Forschungsdatenpublikation besser unterstützen lassen. Wesentliche Aspekte sind dabei die weitgehend automatisierte Metadatenermittlung sowie die Schaffung einer konsistenten Datenbasis als Ausgangspunkt kohärenter interdisziplinärer Forschungsarbeiten in den Umweltwissenschaften.


Entwicklung eines Leitsystems zur Nutzung des ISIMIP-Archivs von Klimafolgensimulationen: Neue Ansätze zur formalen und inhaltlichen Qualitätssicherung (ISI-Access)

Einzelvorhaben: Potsdam-Institut für Klimafolgenforschung (PIK)

Das Vorhaben „ISI-Access“ bezieht sich auf die Weiterentwicklung und Erprobung der Qualitätsstandards von ISIMIP, dem weltweit größten Datenarchiv von modellbasierten Klimafolgendaten, das von der internationalen Klimafolgenforschungsgemeinschaft getragen wird. Hierzu zählen die Entwicklung eines auf inhaltlichen Güteindikatoren beruhenden Leitsystems, die Weiterentwicklung der Metadatenbank, die Erprobung einer Datenversionierung und die Erstellung eines Webportals mit einer Kommentierungsfunktion. Somit soll der Zugang zu dem wachsenden ISIMIP-Datenarchiv vereinfacht und eine schnelle Einschätzung der Datengüte gewährleistet werden, insbesondere auch für die transdisziplinäre und nicht-wissenschaftliche Nutzung.


Kontinuierliches Qualitätsmanagement von dynamischen Forschungsdaten zu Objekten der materiellen Kultur unter Nutzung des LIDO-Standards (KONDA)

Verbundvorhaben: Universität Marburg, Universität Göttingen

Ziel des Vorhabens „KONDA“ ist die Entwicklung eines fortlaufenden Qualitätsmanagementprozesses (QMP) für Forschungsdaten zu ausgewählten Objekten der Kunst- und Kulturwissenschaften, sogenannte materielle Kulturgüter. Diese Daten sind nicht nur sehr heterogen und dynamisch, sondern liegen zusätzlich häufig nur in lokalen Formaten vor. Im Vorhaben soll ein allgemeingültiger QMP für diese Forschungsdaten ausgearbeitet werden. Dieser QMP findet kontinuierlich über den gesamten Lebenszyklus der Daten hinweg statt. Die Dynamik der Daten und somit der zugrundeliegenden Datenmodelle und Datentransformationen können dadurch berücksichtigt werden. Unter Anwendung auf das international anerkannte LIDO-Format (Lightweight Information Describing Objects) wird der QMP in konkrete Kurationskriterien überführt und an ausgewählten Datenbeständen erprobt. Die entwickelten und evaluierten Prozesse werden über Handbücher dokumentiert und der Fachgemeinschaft zur Verfügung gestellt.


Qualitätskriterien und Beschreibungsstandards für die Nanosicherheitsforschung (NanoS-QM)

Verbundvorhaben: Leibniz-Institut für Informationsinfrastruktur Karlsruhe (FIZ), Leibniz-Institut für Arbeitsforschung an der Technischen Universität Dortmund (IfADo), Leibniz-Institut für umweltmedizinische Forschung (IUF), Leibniz-Institut für Werkstofforientierte Technologien (IWT), Leibniz-Institut für neue Materialien (INM)

Im Projekt NanoS-QM sollen Kurationskriterien und Qualitätsstandards für Forschungsdaten auf dem Gebiet der Nanosicherheitsforschung entwickelt und erprobt werden. Um die Ergebnisse der Forschung zur Nanosicherheit über Disziplingrenzen hinweg, aber auch über die Forschung hinaus für die industrielle Anwendung, nachvollziehbar und reproduzierbar zur Verfügung zu stellen, sind übergreifende Beschreibungsstandards und verlässliche Qualitätskriterien notwendig. Da in der Nanosicherheitsforschung multidisziplinär genutzte Forschungsdaten entstehen, arbeiten verschiedene Bereiche interdisziplinär zusammen: Materialwissenschaften, Gesundheit und Toxikologie, Pneumologie, Arbeitssicherheit, Informationsinfrastruktur und Wissensvermittlung.


Entwicklung von nutzerorientierten Kurationskriterien für psychologische Forschungsdaten (PsyCuraDat)

Einzelvorhaben: Leibniz-Zentrum für Psychologische Information und Dokumentation (ZPID)

Im Vorhaben „PsyCuraDat“ soll systematisch und empirisch untersucht werden, wie die Kuration psychologischer Forschungsdaten aus einer nutzerorientierten Perspektive gestaltet werden sollte. Maßgabe ist dabei, den Aufwand zur Datenaufbereitung zu verringern sowie die Nachnutzung auch durch angrenzende Fachdisziplinen zu erhöhen. Ziel ist die Entwicklung eines einheitlichen, nutzerfreundlichen und wissenschaftsgetriebenen Standards zur Kuration von psychologischen Forschungsdaten, der in der Psychologie – auch auf internationaler Ebene – etabliert werden kann.


Erprobung und Anwendung von Kurationskriterien und Qualitätsstandards für audiovisuelle, annotierten Sprachdaten (QUEST)

Verbundvorhaben: Universität Hamburg, Leibniz-Institut für Deutsche Sprache in Mannheim (IDS), Universität Köln, Geisteswissenschaftliche Zentren Berlin (gwz)

Das Vorhaben „QUEST“ legt verbindliche Qualitätsstandards für Sammlungen von audiovisuellen, annotierten Sprachdaten (Sprachkorpora) und deren Metadaten fest und entwickelt Kurationskriterien, die ihre interdisziplinäre Nachnutzung, auch im nicht-wissenschaftlichen Bereich, gewährleisten. Darauf aufbauend soll ein teil-automatisiertes System zur Prüfung und Zertifizierung der Ressourcen implementiert werden, um eine kontinuierliche Qualitätskontrolle für die Gesamtheit der Daten zu schaffen. Insgesamt soll somit ein verlässliches Regelwerk für das Forschungsdatenmanagement von audiovisuellen Sprachdaten mit einem hohen Nachnutzungspotenzial geschaffen werden.


Kuration und Weiterentwicklung von Datenbanken für Röntgen und Neutronen Kleinwinkelstreuung in Biologie und Weicher Materie (SAS-BSOFT)

Verbundvorhaben: Europäisches Laboratorium für Molekularbiologie (EMBL), Technische Hochschule Lübeck

In vielen Bereichen der biologischen und medizinischen Forschung sind Daten, welche die dreidimensionale Struktur von Proteinen – den  „Maschinen“ der Zelle – und ihrer Verbünde mit anderen Zellbestandteilen beschreiben, essenziell. Zur Strukturaufklärung existieren verschiedene technische Verfahren, eines davon ist die Messung der Streuung von Neutronen- oder Röntgenstrahlen, wenn diese in Teilchenbeschleunigern auf die jeweiligen Proben treffen, die sogenannte „Small Angle Scattering“ (SAS) Methode. Am EMBL in Hamburg werden seit 2015 SAS-Daten in die Datenbank SASBDB eingepflegt und so einem breiten Kreis von Forschenden zur Verfügung gestellt. In diesem Projekt geht es vor allem um die Erarbeitung und Erweiterung von Standards zur einheitlichen Kuratierung und qualitativen Bewertung, und damit die Erschließung, von SAS-Datenbeständen, die derzeit noch individuell an den jeweils erzeugenden Großforschungsanlagen vorliegen. Nach entsprechender Validierung und Kuratierung der Daten sollen Nutzende aus verschiedenen Forschungs- und Technologiefeldern einheitlich über SASBDB auf diese zugreifen können. Besonderes Augenmerk liegt im Projekt auf der Abstimmung mit den anderen relevanten Akteuren im SAS-Feld, um die Praktikabilität der vereinbarten Standards, und damit auch ihre langfristige Akzeptanz, sicherzustellen.


Semantische Repräsentation, Vernetzung und Kuratierung von qualitätsgesicherten Materialdaten (STREAM)

Verbundvorhaben: Fraunhofer-Institut für Werkstoffmechanik (IWM), Technische Informationsbibliothek (TIB), Karlsruher Institut für Technologie (KIT), Institut für Angewandte Informatik (InfAI), Fritz-Haber-Institut der Max-Planck-Gesellschaft (FHI)

In den Material- und Werkstoffwissenschaften liegen Herausforderungen im Zusammenhang mit den Forschungsdaten beispielsweise in einem uneinheitlichen Verständnis zur Strukturierung von Materialdaten, der Qualität von Material- und Kontextdaten, der Heterogenität in Datenformaten und -strukturen sowie im fehlenden Standard für ein Forschungsdatenmanagement.

Das Vorhaben „STREAM – Semantische Repräsentation, Vernetzung und Kuratierung von qualitätsgesicherten Materialdaten" zielt darauf ab, die Vollständigkeit und Konsistenz von Material- und Metadaten und deren datenportalübergreifende Nutzbarkeit (z. B. domänenspezifische, regionale, organisationsspezifische Datenportale) im Forschungsdatenmanagement sicherzustellen. Im Ergebnis sollen Materialdaten portalübergreifend vernetzt, durchsucht und exportiert werden sowie effektiv wiederverwendet und geteilt werden können.


Datei- und zugehörige Qualitätsstandards für Forschungsdaten im Bereich Schweißtechnik (WelDX)

Einzelvorhaben: Bundesanstalt für Materialforschung und -prüfung (BAM)

Das Forschungsfeld Schweißtechnik muss mit einer stetig wachsenden Datenkomplexität umgehen, welche durch die Einbindung vielfältiger Sensorik und Gerätetechnik bedingt ist. Es fehlen einheitliche Beschreibungen und Datenformate für erzeugte Forschungsdaten, wodurch keine Veröffentlichung von Rohdaten im Sinne von „Open Science“ stattfindet. Das Einzelvorhaben „Datei- und zugehörige Qualitätsstandards für Forschungsdaten im Bereich Schweißtechnik – WelDX“ hat zum Ziel, den Austausch wissenschaftlicher Forschungsdaten aus dem Bereich der Schweißtechnik auf Basis eines einheitlichen Open Source Dateiformates zu ermöglichen und damit die Einhaltung und Dokumentation geeigneter Qualitätsstandards zu fördern. Das Dateiformat und die Programmierschnittstellen werden der wissenschaftlichen Gemeinschaft Open Source zur Verfügung gestellt und nach Abschluss des Vorhabens über ein unabhängiges Kuratorium weiterentwickelt und betreut.