Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Diese Seite erläutert die Zusammenhänge und ausgewählte Details der Weiternutzung der Metadaten der GDI-DE durch GovData. Dies betrifft insbesondere die Abläufe des Metadatentransportsder Metadatenangabe, das Mapping der zu übertragenden Informationen an sich , relevanten Informationen (die Zuordnung der ISO-Elemente zu DCAT-AP.de-Elementen) sowie die Systematik bei der Zuordnung Zuordnung von Kategorien unter DCAT-AP.de aufgrund von in den ISO-Metadaten enthaltenen Informationen.

...

Der IT-Planungsrat hat DCAT-AP.de als formalen Austauschstandard für allgemeine offene Verwaltungsdaten festgelegt. Das bedeutet, dass die Informationen über Geo-Ressourcen, die unter Open Data fallen und mit entsprechenden Lizenz- bzw. Nutzungsbedingungen versehen sind, ebenfalls in Strukturen gem. DCAT-AP.de zu dokumentieren sind. Da die Geo-Ressourcen idealerweise bereits in der GDI-DE mittels Metadaten gem. ISO 19115/19119/19139 beschrieben sind, wurde zur Vermeidung von Doppelerfassungen ein Weg eine Vorgehensweise etabliert, um die Metadaten aus der GDI-DE für Open Data-Portale unter DCAT-AP.de nutzbar zu machen und eine Auffindbarkeit in Open Data-Portalen automatisch zu ermöglichen.

...

Die ISO-basierten Metadaten der GDI-DE werden über die Standard-CSW-Schnittstelle des Geodatenkatalog.de bereitgestellt. Die "Übersetzung" zu in DCAT-AP.de, d.h. das Extrahieren der relevanten Informationen aus den Metadaten der GDI-DE erfolgt durch einen Ableitungsprozess bei auf Seiten von GovData auf Basis des u.g. abgestimmten Mappings, d.h. auf Seiten der GDI-DE erfolgt keine aktive Ableitung mehr (Anmerkung: bis 2019 wurde durch einen Prozess beim Betrieb GDI-DE der Inhalt des Geodatenkatalog.de in die Struktur OGD abgeleitet und anschließend an GovData übergeben. Dieses Verfahren wird nicht mehr angewendet.).

Anforderungen an die ISO-Metadaten der GDI-DE

Grundsätzlich sind die Vorgaben der GDI-DE einzuhalten, die im Dokument Konventionen zu Metadaten formuliert sind und die auch die Belange von INSPIRE sowie Open Data mit abdeckenberücksichtigen. Details (insbesondere auch zu den nachfolgend aufgeführten Punkten) sind dort nachzulesen. An dieser Stelle erfolgt lediglich eine Zusammenfassung wegen aufgrund der besonderen Bedeutung für die Verwendung Weiternutzung der Metadaten der GDI-DE für GovData:

  • Daten-Dienste-Kopplung:Open Data-Portale sind „Daten-orientiert“, d.h. im Fokus steht die freie Daten-Ressource. Dienste (WMS, WFS, WCS, Atom-Feed etc.) sind Werkzeuge, um auf einen Datenbestand zuzugreifen. Sie Dienste haben in Open Data-Portalen keine eigenen Metadatensätze, sondern werden als "Zugriffswege" der Dokumentation des Datenbestands zugeordnet. Entscheidend für die Gewinnung der Informationen zu den Diensten ist daher eine funktionierende Daten-Dienste-Kopplung in den Metadaten, da ausschließlich darüber die Dienste "erkannt" und dem zugehörigen Datenbestand zugeordnet werden können.
  • Schlüsselwort "opendata": Zur Kennzeichnung der relevanten Daten-Metadaten sehen die Metadatenkonventionen der GDI-DE vor, das Schlüsselwort „opendata“ zu verwenden. Dieses ist das steuernde Merkmal und Indiz für GovData, dass ein relevanter Datenbestand vorliegt, dessen Metadaten nach dem u.g. Mapping abzuleiten sind und dessen Zugriffswege über Dienste in den per Verfolgung der Daten-Dienste-Kopplung auffindbaren Dienst-Metadaten (s.o.) dokumentiert sind.
  • Nutzungsbedingungen: Die zugrunde liegenden Lizenzbedingungen sind aus technischen Gründen in den Metadaten zusätzlich zu den Angaben in menschenlesbarem Freitext in einer bestimmten Syntax anzugeben (sog. JSON-Notation), um im Ableitungsprozess der Metadaten für Open Data-Portale entsprechend berücksichtigt werden zu können. Die besondere Syntax ( JSON) -Notation transportiert in Parameterform die notwendigen Informationen über die verwendete Lizenz (ID und Name), den Verweis auf den Lizenztext sowie den ggf. anzubringenden Quellenvermerk.

Beispiel: {"id":"dl-by-de/2.0", "name": "Datenlizenz Deutschland Namensnennung 2.0", "url": "https://www.govdata.de/dl-de/by-2-0", "quelle": "Quelle: Land NRW (<Jahr des Datenbezugs>)"}

Bitte beachtenHierbei ist Folgendes zu beachten: Die im in der JSON-Ausdruck Notataion anzugebende Lizenz-ID ist gem. der Liste unter https://www.dcat-ap.de/def/licenses/ zu wählen auszuwählen. Gegenüber der bis 2019 unter OGD verwendeten Lizenz-ID aus https://github.com/fraunhoferfokus/ogd-metadata/blob/master/lizenzen/deutschland.json ergeben sich dabei i.d.R. Änderungen, die der folgenden Tabelle entnommen werden können (gelb markiert):

Gegenüberstellung der Lizenz-ID's für Open Data
OGD (alt)DCAT-AP.de (neu)
apacheapache
app_commercialother-commercial
app_freewareother-freeware
app_opensourceother-opensource
bsd-licensebsdlicense
cc-bycc-by
cc-by-4.0cc-by/4.0
cc-by-nc-4.0cc-by-nc/4.0
cc-by-ndcc-by-nd/3.0
cc-by-nd-4.0cc-by-nd/4.0
cc-by-sacc-by-sa
cc-by-sa-4.0cc-by-sa/4.0
cc-nccc-by-nc
cc-pdm-1.0ccpdm/1.0
cc-zerocc-zero
dl-de-by-1.0dl-by-de/1.0
dl-de-by-2.0dl-by-de/2.0
dl-de-by-nc-1.0dl-by-nc-de/1.0
dl-de-zero-2.0dl-zero-de/2.0
geonutzv-de-2013-03-19geoNutz/20130319
gfdlgfdl
gpl-3.0gpl/3.0
mozillamozilla
odc-byodby
odc-byodcpddl
odc-odblodbl
official-workofficialWork
other-closedother-closed
other-openother-open


Mapping der relevanten Informationen

Die Zuordnung, welche Information aus einem ISO-Metadatensatz für in ein bestimmtes Element unter DCAT-AP.de verwendet überführt wird, ist in einem abgestimmten Mapping festgehalten, das 2017 in einem Pilotprojekt zwischen Open.NRW und dem GEOkatalog NRW dokumentiert erarbeitet wurde. Es dient gleichermaßen für die Abbildung der Inhalte des Geodatenkatalog.de für die Verwendung bei GovData.

...

Zur Gruppierung  bzw. Filterung der Suchergebnisse in OpenData-Portalen wie z.B. GovData werden unter DCAT-AP.de die sog. "MDR Data Themes" genutzt. Da die dort verwendeten Begriffe nicht 1:1 die in den ISO-Metadaten der GDI-DE übliche Kategorisierung (Element topicCategory) abbilden, liegt der Ableitung von ISO-Metadaten zu DCAT-AP.de-Strukturen auch ebenso ein präzises Mapping der Kategorien zugrunde. Dadurch wird sichergestellt, dass aus jeder Kategorie der ISO-Metadaten mindestens eine Kategorie für Open Data zugeordnet wird. In vielen Fällen werden automatisch sogar mehrere MDR Data Themes ausgehend von einer einzigen Kategorie der ISO-Metadaten zugeordnet, um die Auffindbarkeit in OpenData-Portalen zu erhöhen. Auch dieses Mapping wurde im Pilotprojekt für Open.NRW erarbeitet und GovData zur Verfügung gestellt.

Die Zuordnung einer OpenData-Kategorie (MDR Data Theme) kann sich durch verschiedene Kriterien ergeben:

  1. Durch den Inhalt im das ISO-Element topicCategory: systematische Zuordnung von OpenData-Kategorien entsprechend der unten aufgeführten Tabelle. Da eine multiple Ausprägung des ISO-Elements topicCategory möglich ist, ergeben sich u.U. auch entsprechend viele OpenData-Kategorien.
  2. Durch das Vorhandensein von Informationen bzgl. INSPIRE im ISO-Metadatensatz (INSPIRE-Thema als Schlüsselwort mit entsprechender Thesaurus-Angabe (GEMET)): Dadurch ist erfolgt eine Zuordnung zusätzlicher OpenData-Kategorien möglich, was als die als fachlich sinnvoll bewertet worden istsind. In vielen Fällen ergibt ein evtl. gesetztes dokumentiertes INSPIRE-Thema jedoch „keine neuen Erkenntnisse“, d.h. es erfolgt keine weitere Zuordnung über diejenige hinaus, die sich aus dem ISO-Element topicCategory ohnehin ergibt.
  3. Durch die direkte Ablage von OpenData-Kategorien (MDR Data Themes) in den Schlüsselwörtern im ISO-Metadatensatz (Element keyword): hierdurch besteht für den Metadatenerfasser die Möglichkeit, ergänzend zum systematischen Mapping aus Nr.1 und ggf. Nr.2 bewusst eine bewusste Zuordnung zu weiteren OpenData-Kategorien zu bewirken. Dazu muss das gewünschte MDR Data Theme als „4-Buchstaben-Code“ ohne Thesaurus-Angabe erfasst werden.

...