Digitales Datenmanagement

Digitales Datenmanagement

Die digitale Transformation hält zunehmend Einzug in das klassische Ingenieurwesen, und gerade im Bereich der Werkstoffwissenschaften zeichnen sich bahnbrechende Innovationen durch moderne Methoden der Datenverarbeitung ab. Deshalb beschäftigt sich die Forschungsgruppe Digital Engineering mit Konzepten zur nachhaltigen Digitalisierung des Managements der Daten, die in den Forschungsbereichen des EMI anfallen.

© FE-Modell: NHTSA/DOT
Die Forschungsgruppe Digital Engineering beschäftigt sich mit Lösungen zum digitalen Management von Forschungsdaten und domänenübergreifenden Datenräumen.

FAIR Data: Findable – Accessible – Interoperable – Reusable Data

In den letzten Jahren hat sich die weltweite Erzeugung heterogener, unstrukturierter Daten rasant beschleunigt. Neben ihrer Unzugänglichkeit ist ein Großteil der Datensätze besonders aufgrund ihrer unzureichenden Auszeichnung jedoch nicht wiederverwendbar. Insbesondere vor dem Hintergrund immer stärker datengetriebener Forschungsansätze ist die große Menge der darin enthaltenen Informationen von entscheidendem Wert für zukünftige FuE-Aktivitäten. Das übergeordnete Ziel des Vorhabens ist deshalb, den gesamten Lebenszyklus von Forschungsdaten zu erschließen und durch die konsequente Umsetzung der FAIR-Data-Prinzipien nutzbar zu machen. Metadaten spielen dabei eine übergeordnete Rolle, da sie die Grundlage zur Beschreibung und Erschließung der Bedeutung von Daten bilden. Semantische Technologien ermöglichen es, Metadaten als Kontextinformationen zu integrieren und so das den Daten zugrunde liegende Wissen nutzbar zu machen.

Interoperabilität

Die umfassende Wiederverwendung von Daten wird auch verhindert, da sich in Institutionen heterogene Datenbestände –teils ungenutzt – in sogenannten Datensilos ansammeln. Die semantische Anreicherung von Daten wirkt dem entgegen und befähigt zu disziplin- und domänenübergreifender Interoperabilität. Aufgrund ihrer hohen Aussagekraft ermöglicht der Einsatz von Ontologien als Wissensorganisationssystem die Erhaltung und Erweiterung von Domänenwissen. Sie stellen die explizite Beschreibung der in einer Domäne vorliegenden Konzepte, deren logischen Beziehungen zueinander sowie der vorherrschenden Regeln und Restriktionen formal dar. Die damit einhergehende mensch- und maschinenverständliche Spezifikation der zugrunde liegenden Datenstrukturen und -inhalte fördert die Interoperabilität zwischen heterogenen Daten, Modellen und Systemen. Dadurch entsteht ein potenziell erfolgsentscheidender Produktivitätsgewinn, da Missverständnisse, kostspielige Fehler sowie Mehrarbeit vermieden werden. Die Forschungsaktivitäten konzentrieren sich nicht nur auf die Maximierung der internen Wertschöpfung der am EMI vorliegenden Forschungsdaten. Gemeinsam mit externen Partnern werden außerdem unternehmensübergreifende Datenräume, wie die International Data Spaces, für die Werkstoffwissenschaften und entsprechende Engineering-Anwendungen nutzbar gemacht. So können durch die Wiederverwendung, vielfältige Nutzung und Kombination von Daten neue Schlussfolgerungen und wertgesteigerte Forschungsergebnisse entstehen. Des Weiteren ermöglicht dies den Einsatz moderner Datenverarbeitungsmethoden im Bereich von Materials Informatics – beispielsweise durch die automatisierte Analyse großer Datenmengen mittels intelligenter Algorithmen. Nicht zuletzt befähigen interoperable Daten und Modelle zu innovativen digitalen Workflows, wie zum Beispiel im Model-Based Systems Engineering.

© Fraunhofer EMI
Einfaches semantisches Netz aus zwei »Resource Description Framework (RDF)«-Graphen.
© Fraunhofer EMI
Digitales Datenmanagement erschließt den gesamten Lebenszyklus von Forschungsdaten nachhaltig. (Quelle: f1000research.com/articles/6-1618/v2)

Reproduzierbarkeit

Die genaue Kenntnis über die Datenhistorie ist entscheidend, um den aktuellen sowie vergangenen Bearbeitungszustand von Ressourcen entlang einer Prozesskette eindeutig adressieren und lückenlos rückverfolgen zu können. Dazu werden Daten und deren Entstehungsprozesse durch semantisch interoperable Metadaten, sogenannte RDF-Graphen, beschrieben. Wenn diese auf Ontologien aufbauen, geht ihr Kontext vollumfänglich und interpretierbar daraus hervor. Die einzelnen Informationsobjekte werden zu einem semantischen Netz logisch miteinander verknüpft – ein Wissensgraph resultiert, und die Transformation von Daten über Information zu Wissen gelingt. Aufbauend auf diesen Prinzipien wird der gesamte Lebenslauf von Ressourcen abgebildet. Dies dient der durchgängigen Transparenz über den aktuellen beziehungsweise vergangenen Zustand von Werkstoffen oder technischen Systemen und der in jedem Prozessschritt anfallenden Daten sowie der Erhöhung der übergreifenden Datenqualität.