https://gdk.gdi-de.org/gdk_harvesting/#/harvesting
Die Harvesting-Übersicht bietet Ihnen einen Überblick über die letzten Harvesting-Vorgänge. Sie enthält folgende Informationen:
- Bezeichnung: Bezeichnung des angeschlossenen Katalogs, entspricht dem Suchfilter "bereitgestellt von" im Geodatenkatalog
- URL: Basis-URL des Dienstes
- Status: active (Harvesting wird automatisch durchgeführt) oder inactive (Harvesting ist pausiert)
- Intervall: Termine für das automatische Harvesting
- Letztes Harvesting: Zeitpunkt des letzten Harvestings
- GDK-DE: Gesamtzahl der im Geodatenkatalog aktuell vorhandenen Metadaten, die dieser Quelle zugeordnet sind
- geharvestet: Anzahl der zum Harvesting-Zeitpunkt in der Quelle vorhandenen Metadaten
- nicht schemakonform: Anzahl der Metadaten, die mangels XML-Schema-Konformität zurückgewiesen worden (bitte fordern Sie ggf. über den Support ein Harvesting-Log an)
- UUID-Duplikate: Anzahl der Metadaten, die bereits aus anderer Quelle bezogen wurden
- hinzugefügt: Anzahl der Metadaten, die neu in den GDK eingetragen wurden
- entfernt: Anzahl der Metadaten, die aus dem GDK entfernt wurden
- unverändert: Anzahl der Metadaten, die unverändert im GDK geblieben sind
- aktualisiert: Anzahl der Metadaten, die durch eine neue Version überschrieben wurden
In der Regel sollte gelten:
- GDK-DE = geharvestet - nicht schemakonform - UUID-Duplikate = hinzugefügt + unverändert + aktualisiert
Bei Abweichungen wenden Sie sich bitte zur genaueren Analyse an den Support und fordern Sie ggf. ein Harvesting-Log an.
3 Comments
Renate Zweer
Danke für die gute Erläuterung!
Zur Formel:
Muss es nicht heißen GDK-DE = geharvestet - nicht schemakonform - UUID-Duplikate = hinzugefügt + unverändert + aktualisiert - entfernt
(Dann passt es bei und auch)
Benjamin Richter
Danke für das Feedback. Auch mit Ihrer Formel erhalte ich allerdings bei einigen der anderen Kataloge eine Abweichung. Das wird noch genauer zu analysieren sein.
Andreas Höhne
Zur Harvesting-Übersicht schlägt die GDI-BW folgende Änderung mit der Bitte um Berücksichtigung vor:
Hier könnten alle, also auch ältere Harvestings enthalten sein.
Spalten:
Anzahl im Katalog: Anzahl der Metadatensätze im zu harvestenden Katalog
Start: Starttermin des Harvestings
Ende: Endtermin des Harvestings
nicht schemakonform: Anzahl der nicht-schemakonformen und deshalb nicht zu übernehmenden Metadatensätze im zu harvestenden Katalog
doppelte UUIDs: doppelte und deshalb nicht zu übernehmende Metadatensätze im zu harvestenden Katalog
Ergebnismenge im GDK: resultierende Menge der Metadatensätze im GDK aus dem zu harvestenden Katalog nach Abzug der Doppelten und nicht-schemakonformen Metadatensätze.
Ursachen: Ursachen für den Zustand (ggf. als Codes je nach Ursache (Werte z.B.: Harvesting erfolgreich; Zielknoten nicht erreichbar; abgebrochen; unvollständig; verspätet gestartet;….))
3. Berechnung: „Ergebnismenge im GDK“= „Anzahl im Katalog“ – „nicht schemakonform“ – „doppelte UUIDs“
4. Wenn Zusammenlegung der bislang jeweils 3 Einzelharvestings der GDI-BW z.B. aus technischen Gründen nicht möglich ist: "BW-komplett" müsste "BW-Rest“ heißen
5. LogFiles bitte direkt als Link hinterlegen