https://gdk.gdi-de.org/gdk_harvesting/#/harvesting

Die Harvesting-Übersicht bietet Ihnen einen Überblick über die letzten Harvesting-Vorgänge. Sie enthält folgende Informationen:

  • Bezeichnung: Bezeichnung des angeschlossenen Katalogs, entspricht dem Suchfilter "bereitgestellt von" im Geodatenkatalog
  • URL: Basis-URL des Dienstes
  • Status: active (Harvesting wird automatisch durchgeführt) oder inactive (Harvesting ist pausiert)
  • Intervall: Termine für das automatische Harvesting
  • Letztes Harvesting: Zeitpunkt des letzten Harvestings
  • GDK-DE: Gesamtzahl der im Geodatenkatalog aktuell vorhandenen Metadaten, die dieser Quelle zugeordnet sind
  • geharvestet: Anzahl der zum Harvesting-Zeitpunkt in der Quelle vorhandenen Metadaten 
  • nicht schema­konform: Anzahl der Metadaten, die mangels XML-Schema-Konformität zurückgewiesen worden (bitte fordern Sie ggf. über den Support ein Harvesting-Log an) 
  • UUID-Duplikate: Anzahl der Metadaten, die bereits aus anderer Quelle bezogen wurden
  • hinzugefügt: Anzahl der Metadaten, die neu in den GDK eingetragen wurden
  • entfernt: Anzahl der Metadaten, die aus dem GDK entfernt wurden
  • unverändert: Anzahl der Metadaten, die unverändert im GDK geblieben sind
  • aktualisiert: Anzahl der Metadaten, die durch eine neue Version überschrieben wurden

In der Regel sollte gelten:

  • GDK-DE = geharvestet - nicht schemakonform - UUID-Duplikate = hinzugefügt + unverändert + aktualisiert

Bei Abweichungen wenden Sie sich bitte zur genaueren Analyse an den Support und fordern Sie ggf. ein Harvesting-Log an.

  • Keine Stichwörter

3 Kommentare

  1. Renate Zweer sagt:

    Danke für die gute Erläuterung!

    Zur Formel:

    Muss es nicht heißen GDK-DE = geharvestet - nicht schemakonform - UUID-Duplikate = hinzugefügt + unverändert + aktualisiert - entfernt 

    (Dann passt es bei und auch)

    1. Benjamin Richter sagt:

      Danke für das Feedback. Auch mit Ihrer Formel erhalte ich allerdings bei einigen der anderen Kataloge eine Abweichung. Das wird noch genauer zu analysieren sein.

  2. Andreas Höhne sagt:

    Zur Harvesting-Übersicht schlägt die GDI-BW folgende Änderung mit der Bitte um Berücksichtigung vor:

    1. Übernahme der „Landschaft der Kataloge“ in die WIKI-Doku als Übersicht, wann welche Kataloge in welcher Abfolge im Regelfall geharvestet werden
    2. Umgestaltete und verschlankte Tabelle als Dokumentation der Harvesting-Vorgänge.
      Hier könnten alle, also auch ältere Harvestings enthalten sein.

         Spalten:

          Anzahl im Katalog: Anzahl der Metadatensätze im zu harvestenden Katalog

          Start: Starttermin des Harvestings

          Ende: Endtermin des Harvestings

         nicht schemakonform: Anzahl der nicht-schemakonformen und deshalb nicht zu übernehmenden Metadatensätze im zu harvestenden Katalog

         doppelte UUIDs: doppelte und deshalb nicht zu übernehmende Metadatensätze im zu harvestenden Katalog

         Ergebnismenge im GDK: resultierende Menge der Metadatensätze im GDK aus dem zu harvestenden Katalog nach Abzug der Doppelten und nicht-schemakonformen Metadatensätze.

        Ursachen: Ursachen für den Zustand (ggf. als Codes je nach Ursache (Werte z.B.: Harvesting erfolgreich; Zielknoten nicht erreichbar; abgebrochen; unvollständig; verspätet gestartet;….))

    3. Berechnung: „Ergebnismenge im GDK“= „Anzahl im Katalog“ – „nicht schemakonform“ – „doppelte UUIDs“

    4. Wenn Zusammenlegung der bislang jeweils 3 Einzelharvestings der GDI-BW z.B. aus technischen Gründen nicht möglich ist: "BW-komplett" müsste "BW-Rest“ heißen

    5. LogFiles bitte direkt als Link hinterlegen