Hintergrund zu diesem Papier

Der Ansprechpersonen-Workshop (AP-WS) zum Thema "Datenharmonisierung" im Sept. 2024 hat gezeigt, dass die Datenharmonisierung einer von mehreren Wegen ist, um Daten aus unterschiedlichen Quellen gemeinsam nutzen zu können. In diesem Papier werden die Wege, die beim AP-WS vorgestellt wurden, sowie weitere Projekte zusammengefasst, um einen aktuellen Überblick zu geben. Das Papier ist als "lebendiges Dokument" konzipiert, dass bei Bedarf ergänzt und fortgeschrieben werden kann.

Nutzbare Geodaten zeichnen sich durch folgende Eigenschaften aus:

Welche Wege gibt es, um nutzbare Daten zu schaffen?

Datenharmonisierung durch zentrale Stelle

Vorgehen:

  1. Dezentral gehaltene Daten werden an eine zentrale Stelle geliefert. 
  2. Diese zentrale Stelle fügt die originären Daten zusammen, bringt die Daten in ein gemeinsames Datenmodell mit den entsprechenden Metadaten. 

Beispiele:

Vorteile:

Nachteile:

Aufgabe einer koordinierenden Stelle:

Interoperabilität der dezentral bereitgestellten Daten (mit der Möglichkeit der einfachen Harmonisierung durch die datennutzende Stelle)

Vorgehen:

  1. Es gibt konkrete Vorgaben für die Bereitstellung der (dezentralen) Daten. Die Daten, die von verschiedenen Stellen bereitgestellt werden, sind alle im gleichen Datenformat mit einheitlichen Metadaten.
  2. Welche Vorgaben für eine dezentrale Bereitstellung getroffen werden müssen, beschreibt das Interoperabilitätskonzept. Im Falle von INSPIRE gibt es zusätzlich zur Durchführungsverordnung die technischen Leitfäden mit den fachspezifischen Details.

Beispiele:

Vorteile:

Nachteile:

Aufgabe einer koordinierenden Stelle

Technologie-/KI-gestützte Harmonisierung (Vortrag D. Martini)

Vorgehen:

Beispiele:

Vorteile:

Nachteile:

Aufgaben einer koordinierenden Stelle

Semantische Beschreibung der Daten (Ansatz von RP)

Vorgehen:

Beispiele:

Vorteile: 

Nachteile:

Aufgabe einer koordinierenden Stelle:

Bewertung der Methoden

Die folgende Einschätzung der Qualitätskriterien "Aktualität der Daten", "Konsistenz der Daten" und "Kontrolle der Ergebnisse" und generell der Aufwand für eine koordinierende Stelle kann als Grundlage für die Bewertung der verschiedenen Ansätze genutzt werden. 

MethodeAktualitätKonsistenzKontrolleAufwand für koordinierende Stelle
DatenharmonisierungMittelHochHochHoch
Dezentrale InteroperabilitätHochGeringGeringMittel
Technologie-/KI-gestützte HarmonisierungSehr hochHochHochSehr hoch
Semantische BeschreibungHochMittelMittelMittel

Fazit und Empfehlungen

Die Technologie-/KI-gestützte Harmonisierung nutzt semantische Technologien und maschinelles Lernen zur Interoperabilität und Datenqualität:

Aus Sicht der Kst. GDI-DE ist die Technologie-/KI-gestützte Harmonisierung der langfristig nachhaltigste Ansatz. Allerdings ist der initiale Aufwand hoch, weshalb eine Hybridstrategie empfohlen wird: Zentrale und semantische Harmonisierung für kurzfristige Umsetzung, während Technologie-/KI-gestützte Lösungen langfristig entwickelt werden.