Übersicht:
Favoritenliste:
Favorite Pages
There are currently no pages on your favorites list. You can add pages to this list by selecting Favorite from the Tools menu on the page you're viewing. |
Der IT-Planungsrat hat DCAT-AP.de als formalen Austauschstandard für allgemeine offene Verwaltungsdaten festgelegt. Das bedeutet, dass die Informationen über Geo-Ressourcen, die unter Open Data fallen und mit entsprechenden Lizenz- bzw. Nutzungsbedingungen versehen sind, ebenfalls in Strukturen gem. DCAT-AP.de zu dokumentieren sind. Da die Geo-Ressourcen idealerweise bereits in der GDI-DE mittels Metadaten gem. ISO 19115/19119/19139 beschrieben sind, wurde zur Vermeidung von Doppelerfassungen eine Vorgehensweise etabliert, um die Metadaten aus der GDI-DE für Open Data-Portale unter DCAT-AP.de nutzbar zu machen und eine Auffindbarkeit in Open Data-Portalen automatisch zu ermöglichen.
Die ISO-basierten Metadaten der GDI-DE werden über die Standard-CSW-Schnittstelle des Geodatenkatalog.de bereitgestellt. Die "Übersetzung" in DCAT-AP.de, d.h. das Extrahieren der relevanten Informationen aus den Metadaten der GDI-DE erfolgt durch einen Ableitungsprozess auf Seiten von GovData auf Basis des u.g. abgestimmten Mappings, d.h. auf Seiten der GDI-DE erfolgt keine aktive Ableitung mehr (Anmerkung: bis 2019 wurde durch einen Prozess beim Betrieb GDI-DE der Inhalt des Geodatenkatalog.de in die Struktur OGD abgeleitet und anschließend an GovData übergeben. Dieses Verfahren wird nicht mehr angewendet.).
Grundsätzlich sind die Vorgaben der GDI-DE einzuhalten, die im Dokument Konventionen zu Metadaten formuliert sind und auch die Belange von INSPIRE sowie Open Data berücksichtigen. Details (insbesondere zu den nachfolgend aufgeführten Punkten) sind dort nachzulesen. An dieser Stelle erfolgt lediglich eine Zusammenfassung aufgrund der besonderen Bedeutung für die Weiternutzung der Metadaten der GDI-DE für GovData:
Beispiel
{ "id":"dl-by-de/2.0", "name": "Datenlizenz Deutschland Namensnennung 2.0", "url": "https://www.govdata.de/dl-de/by-2-0", "quelle": "Quelle: Land NRW (<Jahr des Datenbezugs>)" }
Hinweis!
Hierbei ist Folgendes zu beachten: Die in der JSON-Notataion anzugebende Lizenz-ID ist gem. der Liste unter https://www.dcat-ap.de/def/licenses/ (Spalte "Lizenzcode") auszuwählen. Gegenüber der bis 2019 unter OGD verwendeten Lizenz-ID aus https://github.com/fraunhoferfokus/ogd-metadata/blob/master/lizenzen/deutschland.json ergeben sich dabei i. d. R. Änderungen, die der folgenden Tabelle entnommen werden können (gelb markiert):
Die Zuordnung, welche Information aus einem ISO-Metadatensatz in ein bestimmtes Element unter DCAT-AP.de überführt wird, ist in einem abgestimmten Mapping festgehalten, das 2017 in einem Pilotprojekt zwischen Open.NRW und dem GEOkatalog NRW erarbeitet und im Jahr 2021 gemeinsam mit der GKSt. GovData präzisiert wurde. Es dient gleichermaßen für die Abbildung der Inhalte des Geodatenkatalog.de für die Verwendung bei GovData.
Das Mapping ist als Excel-Tabelle dokumentiert.
Bei der Interpretation der ISO-Metadaten finden darüber hinaus folgende Grundsätze Anwendung:
Zur Gruppierung bzw. Filterung der Suchergebnisse in OpenData-Portalen wie z.B. GovData werden unter DCAT-AP.de die sog. "MDR Data Themes" genutzt. Da die dort verwendeten Begriffe nicht 1:1 die in den ISO-Metadaten der GDI-DE übliche Kategorisierung (Element topicCategory) abbilden, liegt der Ableitung von ISO-Metadaten zu DCAT-AP.de-Strukturen ebenso ein präzises Mapping der Kategorien zugrunde. Dadurch wird sichergestellt, dass jeder Kategorie der ISO-Metadaten mindestens eine Kategorie für Open Data zugeordnet wird. In vielen Fällen werden automatisch sogar mehrere MDR Data Themes ausgehend von einer einzigen Kategorie der ISO-Metadaten zugeordnet, um die Auffindbarkeit in OpenData-Portalen zu erhöhen. Auch dieses Mapping wurde im Pilotprojekt für Open.NRW erarbeitet und GovData zur Verfügung gestellt.
Die Zuordnung einer OpenData-Kategorie (MDR Data Theme) kann sich durch verschiedene Kriterien ergeben:
Die folgende Tabelle dokumentiert die Ableitung gem. der Nr.1 und 2:
17 Comments
Martin Thal
Im JSON-Schnipsel (siehe Beispiel) sind Leerzeichen nach Komma und Doppelpunkt mit reingerutscht. Diese gehören nicht dorthin, oder?
Peter Kochmann
M.W. ist das unkritisch. Hast Du gegenteilige Erfahrungen gemacht?
Martin Thal
Nein noch nicht. Bin nur darüber gestolpert, weil ich die Schreibweise der neuen Lizenz ID für GovData in einem InGrid Ticket überprüft habe. Dort wurden keine Leerzeichen verwendet. Da es mir aufgefallen ist, wollte ich den Hinweis geben.
Anja Litka
Nach Durchsicht der entsprechenden xsl-Datei (iso2dcat.xsl) erfolgt eine Entfernung der führende und folgende Leerzeichen am Anfang und Ende des übergebenen Strings ("starts-with(normalize-space(.), '{')"). Demnach werden vorhandene/überzählige Leerzeichen im JSON-Schnipsel ignoriert.
Peter Kochmann
Die Seite wurde überarbeitet bzw. ergänzt.
Dies betrifft die Klarstellung, dass die Metadaten zunächst (nach den dafür geltenden Anforderungen) im Geodatenkatalog.de aufgenommen sein müssen.
Außerdem wurden die bei GovData zwischenzeitlich etablierten Grundsätze zur Interpretation (1. keine Daten ohne Distributionen und 2. Umgang mit Lizenzangaben in Dienst-Metadaten) den Informationen zum Mapping hinzugefügt.
Peter Kochmann
Auf dieser Seite ist ab dem 15.12.2021 das präzisierte Mapping zu finden, das gemeinsam durch die GKSt. GovData, Open.NRW bzw. MWIDE NRW, die GDI-DE sowie die jeweils beauftragten Dienstleister für die technische Umsetzung abgestimmt wurde. Dabei betreffen die Präzisierungen vor allem die Dokumentation ("welche Information genau liefert mir das jeweilige Element?") und die daraus ableitbaren Entscheidungen, das Element gezielt und abhängig vom Inhalt zu verwenden. Der gesamte Prozess der Interpretation der Metadaten aus der GDI-DE nach den beschriebenen Grundsätzen ist dagegen unverändert.
Peter Kochmann
Als Nachtrag gab es eine geringfügige Überarbeitung bei der Definition des DCAT-Elements #70 "Datenstruktur". Substantiell hat sich dadurch jedoch nichts am Mapping geändert.
Steffen Bach
Kurze Frage. In welchen Zyklen ernten die Betreiber des GovData Portals den Geodatenkatalog.DE ab?
Anja Litka
Ca. alle 2 Tage. Du kannst dies über die "Aktivitätsanzeige" von jedem Datensatz nachschauen → s. bsp.haft "INSPIRE BW Verwaltungseinheiten ATKIS Basis-DLM"
Martin Thal
Ich klinke mich kurz ein und möchte meine Sicht wiedergeben:
GovData erntet keine Metadaten vom Geodatenkatalog.de sondern vom Geoportal.de
So jedenfalls mein Verständnis. Sehe ich das so richtig?
Anja Litka
Nein Martin Thal, wie kommst du darauf? GovData harvestet unsere CSW-Schnittstelle. Über https://ckan.govdata.de/ kannst über das Attribut "metadata_harvested_portal" von jedem Datensatz die Katalog-URL einsehen → s. bsp.haft:
Martin Thal
Anja Litka , dein Link bei "INSPIRE HH Verkehrsnetze HH-SIB" bestätigt meine Aussage, dass GovData die Metadaten vom Geoportal.de erhält und nicht wie ursprünglich in der Frage von Steffen Bach formuliert über den Geodatenkatalog.de. Für mich sind Geoportal.de und Geodatenkatalog.de zwei getrennte Portale, auch wenn beide vom BKG betrieben werden.
Das Beispiel Verkehrsdaten Rad (Infrarotdetektoren) Hamburg lassen wir am besten für diese Diskussion weg, weil es für den HH-Metadatenfluss von nur opendata und opendata mit inspireidentifiziert zwei Wege gibt.
Einmal über das Transparenzportal (TP) bei nur opendata und einmal über die GDI-DE bei opendata mit inspireidentifiziert.
Steffen Bach
Danke. Dann werden wir hier Untersuchungen anstellen müssen.
Anja Litka
Rückmeldung von GovData (S E I T E N B A U GmbH) und zur Klarstellung Martin Thal :
Sabine Schütze
Ist das in der Excel-Tabelle dokumentierte Mapping von 2022 noch aktuell?
Peter Kochmann
Ja, bis auf die jüngste Ergänzung der Kennzeichnung für HVD in den ISO-Schlüsselwörtern und daraus Befüllung der zusätzlichen zwei Elemente aus DCAT-AP-HVD.
Peter Kochmann
Das Mapping in der Excel-Tabelle ist nun ergänzt worden und enthält die Berücksichtigung der HVD-Kennzeichnung in Daten-Metadaten.