BEANTWORTET


Unter „2.1 Erfasste Datensätze“ heißt es eingangs „…sowie Datensätze, die im Zusammenhang mit den in der zweiten folgenden Tabelle aufgeführten Rechtsakten erstellt oder generiert werden. Dazu gehören die aktuellsten Datensätze sowie historische Versionen von Datensätzen, die in maschinenlesbarem Format in allen Generalisierungsgraden bis zum Maßstab 1:5 000 vorliegen und zusammen den gesamten Mitgliedstaat abdecken…“

  1. Welches Datenformat wird unter „maschinenlesbar“ verstanden (RDF, XML, JSON, SHP, XLS, PDF, etc.)?
  2. Wo müssen diese Daten vorliegen (z.B. Internet/Intranet, Fachsysteme/Datenbanken, Excel-Tabellen/Dateisysteme, etc.)?
  3. Wie ist der Passus „…zusammen den gesamten Mitgliedstaat abdecken“ auch vor dem Hintergrund, dass möglicherweise Zeitreihendaten angesprochen sind, zu interpretieren?
  4. Wie ist die Aussage zum Maßstab zu verstehen? Für die Reportings der angesprochenen Richtlinien im Umweltbereich werden umfangreiche Bestände von Zeitreihendaten erhoben, welche in der Regel Messstellen/Punktkoordinaten zugeordnet und als solche keinem Maßstabsbereich zuzuordnen sind.

Verweis auf FAQs

  1. Welches Datenformat wird unter „maschinenlesbar“ verstanden (RDF, XML, JSON, SHP, XLS, PDF, etc.)?

  2. Wo müssen die in Abschnitt 2.1 des Anhangs beschriebenen Datensätze, “die im Zusammenhang mit den in der zweiten folgenden Tabelle aufgeführten Rechtsakten erstellt oder generiert werden", vorliegen (z.B. Internet/Intranet, Fachsysteme/Datenbanken, Excel-Tabellen/Dateisysteme, etc.), um unter die Vorgaben der DVO-HVD zu fallen?

  3. Wie ist der Passus „… die zusammen den gesamten Mitgliedstaat abdecken“, insbesondere für Zeitreihendaten, zu interpretieren?

  4. Wie ist die Aussage zum Maßstab in Abschnitt 2.1 des Anhangs zu verstehen? Für die Berichterstattung unter den angesprochenen Richtlinien im Umweltbereich werden umfangreiche Bestände von Zeitreihendaten erhoben, welche in der Regel Messstellen/Punktkoordinaten zugeordnet und als solche keinem Maßstabsbereich zuzuordnen sind.

3 Kommentare

  1. Renate Zweer sagt:

    Meine Beiträge sind nur rudimentär, aber ich fange mal an:

    1.

    In der MIG-T-Sitzung vom 25.11.2022 2022-11-24_25 MIG/MIG-T Meeting (Brüssel) - INSPIRE-Umsetzung - GDI-DE Wiki gab es eine Präsentation zum Thema HVD. Mir hatte sie damals geholfen, zusammen mit den Notizen von Daniela Witter auf der Seite. Dort ist u.a. "maschinenlesbares Format" so definiert:  structured so that software applications can easily identify, recognise and extract specific data, including individual statements of fact, and their internal structure.

    Damit ist zumindest xml/json dabei, pdf, xls ist draussen. Mehr können die Formatexperten sagen. 

    Zu 2:

    Ich bin unsicher, ob ich die Intention dieser Frage richtig verstehe:

    Die Daten müssen im Internet bereitgestellt werden über OGC-Dienste wie WFS oder OGC API-Feature. Ob die Daten originär in Fachdatenbanken oder Excel oder im Filesystem vorliegen ist unerheblich. Sie müssen diese mobilisieren, also erreichbar machen für die Abgabe-Schnittstellen.

    Zu 3.

    Ich habe es bislang als vorsichtige Formulierung des Wunsches nach einem landesweiten Datensatz gelesen. Sie haben aber recht: Die Frage stellt sich und ich bin gespannt, wer mehr weiß.

    Zu 4.

    Die Aussage zum Maßstab hat uns auch irritiert.

    Auf der Seite Bereitstellung von Gebäuden und Flurstücken in der verfügbaren räumlichen Auflösung - INSPIRE-Umsetzung - GDI-DE Wiki gibt es einen Beitrag von Daniela Witter hierzu -  bezogen auf Flurstücke.

    Ihre Frage nach der Maßstabsrelevanz wirft bei mir – nun –  die generelle Frage nach den Darstellungsdiensten auf. Soweit ich – nun – sehe, geht es bei der Bereitstellung von HVD nicht um Darstellungsdienste. Ich hoffe auf Richtigstellung durch die Kolleginnen und Kollegen.


  2. Zu (1) gibt es tatsächlich die Definition aus der Open Data Directive:  „maschinenlesbares Format“ ein Dateiformat, das so strukturiert ist, dass Softwareanwendungen konkrete Daten, einschließlich einzelner Sachverhaltsdarstellungen und deren interner Struktur, leicht identifizieren, erkennen und extrahieren können. 

    Ich würde nach dieser Definition alle genannten Formate mit Ausnahme von PDF als maschinenlesbar betrachten.

    Z.T. werden im Anhang auch konkrete Formate genannt bzw. weitere Vorgaben gemacht (z.B. „in einem öffentlich dokumentierten, unionsweit oder international anerkannten offenen, maschinenlesbaren Format“), was eine Orientierung bieten kann.

    Zu (2) stimme ich zu:  Dies betrifft alle Datensätze, die „im Zusammenhang mit den in der zweiten folgenden Tabelle aufgeführten Rechtsakten erstellt oder generiert werden“, unabhängig davon, wie sie momentan vorgehalten werden.

    Zu (3) würde ich sagen, es ist gemeint, dass alle den Mitgliedsstaat betreffenden Daten bereitzustellen sind, z.B. alle Messstellen in einem nationalen Messnetz.

    Zu (4): Diese Angaben gelten in der Tat primär für flächige und linienförmige Geodaten. Der Standort einer Messstation ist einfach über deren Koordinaten bereitzustellen.

  3. Maschinenlesbar sind Geodatenformate für mich, wenn sie in GDAL zu finden sind.

    https://gdal.org/

    Damit ist sichergestellt, dass ich in das Format hineinschauen kann, um Daten zu extrahieren. Dabei ist zu berücksichtigen, dass es immer Formate gibt, die technische Einschränkungen haben und somit Daten nicht vollständig abbilden können. Ich muss also bei einem maschinenlesbaren Format prüfen, ob ich dorthin exportieren und von dort aus wieder verlustfrei importieren kann. Zumindest die Abweichungen sollten mir als datenhaltender Stelle bekannt sein, wenn ich nur ausgewählte Formate anbieten möchte.

    Die Maschinenlesbarkeit wird deutlich vereinfacht, wenn ich keine binär verschlüsselten Formate verwendet, sondern Formate, die auf reinem Text basieren. Dazu gehören auch XML-Formate wie GML.

    Wenn ein technisches Formt für Geodaten nicht in der GDAL-Bibliothek zu finden ist, kann es getrost als nutzlos für die Geodateninfrastruktur betrachtet werden. Die Daten sind dann einem Vendor-Lock-In zum Opfer gefallen und können sogar dauerhaft verloren sein, wenn sie nicht mehr entschlüsselt werden können und auch der Algorithmus zum Entschlüsseln durch denjenigen, der sie einst verschlüsselte, nicht der Öffentlichkeit zur Verfügung gestellt wird. Die Daten sind nicht mehr nutzbar und müssen neu erstellt werden. Das ist dann der Worst Case, aber traurigerweise durchaus in der freien Wildbahn weiterhin anzutreffen.