https://gdk.gdi-de.org/gdk_harvesting/#/harvesting
Die Harvesting-Übersicht bietet Ihnen einen Überblick über die letzten Harvesting-Vorgänge. Sie enthält folgende Informationen:
- Bezeichnung: Bezeichnung des angeschlossenen Katalogs, entspricht dem Suchfilter "bereitgestellt von" im Geodatenkatalog
- URL: Basis-URL des Dienstes
- Status: active (Harvesting wird automatisch durchgeführt) oder inactive (Harvesting ist pausiert)
- Intervall: Termine für das automatische Harvesting
- Letztes Harvesting: Zeitpunkt des letzten Harvestings
- GDK-DE: Gesamtzahl der im Geodatenkatalog aktuell vorhandenen Metadaten, die dieser Quelle zugeordnet sind
- geharvestet: Anzahl der zum Harvesting-Zeitpunkt in der Quelle vorhandenen Metadaten
- nicht schemakonform: Anzahl der Metadaten, die mangels XML-Schema-Konformität zurückgewiesen worden (bitte fordern Sie ggf. über den Support ein Harvesting-Log an)
- UUID-Duplikate: Anzahl der Metadaten, die bereits aus anderer Quelle bezogen wurden
- hinzugefügt: Anzahl der Metadaten, die neu in den GDK eingetragen wurden
- entfernt: Anzahl der Metadaten, die aus dem GDK entfernt wurden
- unverändert: Anzahl der Metadaten, die unverändert im GDK geblieben sind
- aktualisiert: Anzahl der Metadaten, die durch eine neue Version überschrieben wurden
In der Regel sollte gelten:
- GDK-DE = geharvestet - nicht schemakonform - UUID-Duplikate = hinzugefügt + unverändert + aktualisiert
Bei Abweichungen wenden Sie sich bitte zur genaueren Analyse an den Support und fordern Sie ggf. ein Harvesting-Log an.
3 Kommentare
Renate Zweer sagt:
Danke für die gute Erläuterung!
Zur Formel:
Muss es nicht heißen GDK-DE = geharvestet - nicht schemakonform - UUID-Duplikate = hinzugefügt + unverändert + aktualisiert - entfernt
(Dann passt es bei und auch)
Benjamin Richter sagt:
Danke für das Feedback. Auch mit Ihrer Formel erhalte ich allerdings bei einigen der anderen Kataloge eine Abweichung. Das wird noch genauer zu analysieren sein.
Andreas Höhne sagt:
Zur Harvesting-Übersicht schlägt die GDI-BW folgende Änderung mit der Bitte um Berücksichtigung vor:
Hier könnten alle, also auch ältere Harvestings enthalten sein.
Spalten:
Anzahl im Katalog: Anzahl der Metadatensätze im zu harvestenden Katalog
Start: Starttermin des Harvestings
Ende: Endtermin des Harvestings
nicht schemakonform: Anzahl der nicht-schemakonformen und deshalb nicht zu übernehmenden Metadatensätze im zu harvestenden Katalog
doppelte UUIDs: doppelte und deshalb nicht zu übernehmende Metadatensätze im zu harvestenden Katalog
Ergebnismenge im GDK: resultierende Menge der Metadatensätze im GDK aus dem zu harvestenden Katalog nach Abzug der Doppelten und nicht-schemakonformen Metadatensätze.
Ursachen: Ursachen für den Zustand (ggf. als Codes je nach Ursache (Werte z.B.: Harvesting erfolgreich; Zielknoten nicht erreichbar; abgebrochen; unvollständig; verspätet gestartet;….))
3. Berechnung: „Ergebnismenge im GDK“= „Anzahl im Katalog“ – „nicht schemakonform“ – „doppelte UUIDs“
4. Wenn Zusammenlegung der bislang jeweils 3 Einzelharvestings der GDI-BW z.B. aus technischen Gründen nicht möglich ist: "BW-komplett" müsste "BW-Rest“ heißen
5. LogFiles bitte direkt als Link hinterlegen