https://gdk.gdi-de.org/gdk_harvesting/#/harvesting

Die Harvesting-Übersicht bietet Ihnen einen Überblick über die letzten Harvesting-Vorgänge. Sie enthält folgende Informationen:

  • Bezeichnung: Bezeichnung des angeschlossenen Katalogs, entspricht dem Suchfilter "bereitgestellt von" im Geodatenkatalog
  • URL: Basis-URL des Dienstes
  • Status: active (Harvesting wird automatisch durchgeführt) oder inactive (Harvesting ist pausiert)
  • Intervall: Termine für das automatische Harvesting
  • Letztes Harvesting: Zeitpunkt des letzten Harvestings
  • GDK-DE: Gesamtzahl der im Geodatenkatalog aktuell vorhandenen Metadaten, die dieser Quelle zugeordnet sind
  • geharvestet: Anzahl der zum Harvesting-Zeitpunkt in der Quelle vorhandenen Metadaten 
  • nicht schema­konform: Anzahl der Metadaten, die mangels XML-Schema-Konformität zurückgewiesen worden (bitte fordern Sie ggf. über den Support ein Harvesting-Log an) 
  • UUID-Duplikate: Anzahl der Metadaten, die bereits aus anderer Quelle bezogen wurden
  • hinzugefügt: Anzahl der Metadaten, die neu in den GDK eingetragen wurden
  • entfernt: Anzahl der Metadaten, die aus dem GDK entfernt wurden
  • unverändert: Anzahl der Metadaten, die unverändert im GDK geblieben sind
  • aktualisiert: Anzahl der Metadaten, die durch eine neue Version überschrieben wurden

In der Regel sollte gelten:

  • GDK-DE = geharvestet - nicht schemakonform - UUID-Duplikate = hinzugefügt + unverändert + aktualisiert

Bei Abweichungen wenden Sie sich bitte zur genaueren Analyse an den Support und fordern Sie ggf. ein Harvesting-Log an.

  • No labels

3 Comments

  1. Danke für die gute Erläuterung!

    Zur Formel:

    Muss es nicht heißen GDK-DE = geharvestet - nicht schemakonform - UUID-Duplikate = hinzugefügt + unverändert + aktualisiert - entfernt 

    (Dann passt es bei und auch)

    1. Danke für das Feedback. Auch mit Ihrer Formel erhalte ich allerdings bei einigen der anderen Kataloge eine Abweichung. Das wird noch genauer zu analysieren sein.

  2. Zur Harvesting-Übersicht schlägt die GDI-BW folgende Änderung mit der Bitte um Berücksichtigung vor:

    1. Übernahme der „Landschaft der Kataloge“ in die WIKI-Doku als Übersicht, wann welche Kataloge in welcher Abfolge im Regelfall geharvestet werden
    2. Umgestaltete und verschlankte Tabelle als Dokumentation der Harvesting-Vorgänge.
      Hier könnten alle, also auch ältere Harvestings enthalten sein.

         Spalten:

          Anzahl im Katalog: Anzahl der Metadatensätze im zu harvestenden Katalog

          Start: Starttermin des Harvestings

          Ende: Endtermin des Harvestings

         nicht schemakonform: Anzahl der nicht-schemakonformen und deshalb nicht zu übernehmenden Metadatensätze im zu harvestenden Katalog

         doppelte UUIDs: doppelte und deshalb nicht zu übernehmende Metadatensätze im zu harvestenden Katalog

         Ergebnismenge im GDK: resultierende Menge der Metadatensätze im GDK aus dem zu harvestenden Katalog nach Abzug der Doppelten und nicht-schemakonformen Metadatensätze.

        Ursachen: Ursachen für den Zustand (ggf. als Codes je nach Ursache (Werte z.B.: Harvesting erfolgreich; Zielknoten nicht erreichbar; abgebrochen; unvollständig; verspätet gestartet;….))

    3. Berechnung: „Ergebnismenge im GDK“= „Anzahl im Katalog“ – „nicht schemakonform“ – „doppelte UUIDs“

    4. Wenn Zusammenlegung der bislang jeweils 3 Einzelharvestings der GDI-BW z.B. aus technischen Gründen nicht möglich ist: "BW-komplett" müsste "BW-Rest“ heißen

    5. LogFiles bitte direkt als Link hinterlegen