Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Die hier gelisteten Anforderungen sollten weitestgehend durch die eingesetzte Software bei der Erstellung neuer Codelisten und neuer Codes in einer Codeliste erfüllt werden. Für das Erfüllen der weitergehenden semantischen Anforderungen ist es notwendig, dass der jeweilige Control Body in Zusammenarbeit mit dem Submitter für eine bestmögliche Anwendung der Vorgaben einsteht. Der Submitter spricht im Regelfall für eine Gruppe von Personen mit dem gleichen fachlichen Interesse (z. B. Fachnetzwerk).


Nr.AnforderungPriorität
1

Jede Codeliste benötigt eine klar verständliche Beschreibung, aus der hervorgeht, auf welchen fachlichen Grundlagen sie beruht bzw. um was für eine Klassifikation es sich handelt. Codelisten sind für eine Nachnutzung vorgesehen, deshalb muss eine Codeliste auch für Fachfremde verständlich sein. Im folgenden werden entsprechende Hinweise zur Formulierung gegeben:

Die Beschreibung der Codeliste soll in einer oder mehreren natürlichen Sprachen klar und verständlich lesbar sein. Die Codeliste soll kurz und prägnant beschrieben sein. Die inhaltliche Zusammenfassung soll die wichtigsten Informationen zur Codeliste enthalten. Dementsprechend können sich diese auf die Hauptmerkmale der Codeliste beziehen, oder aber die räumliche Anwendung oder das fachliche Einsatzgebiet der Codeliste mit einbeziehen.

Darüber hinaus soll Folgendes beachtet werden:

Die Kernaussage wird im ersten Satz (ca.256 Zeichen) zusammengefasst. Es wird immer in ganzen Sätzen formuliert. Nur gängige und geläufige Abkürzungen und Akronyme werden verwendet, andernfalls sind diese zu erläutern. Fachterminologie ist durch alternative Begriffe zu ergänzen, wenn die Fachterminologie der allgemeinen Öffentlichkeit nicht bekannt sind. Zur eigenen Überprüfung können bei der Erstellung einer Beschreibung der Codeliste folgende Fragen als Orientierung genutzt werden. Die Beantwortung der Fragen soll durch die Beschreibung klar und unmissverständlich möglich sein:

  • Welche Klassifikation zeigt oder beschreibt diese Codeliste?
  • Wie grenzt sich diese Codeliste von ähnlichen Codelisten ab?
  • Gibt es Besonderheiten bei dieser Codeliste?
  • Welches ist die Zielgruppe dieser Codeliste?
  • Warum existiert diese Codeliste?
  • Wie ist diese Codeliste entstanden?
  • Welchem Zweck dient diese Codeliste?
  • Wer ist verantwortlich für die Bereitstellung dieser Codeliste?

Die verantwortliche Organisation, die diese Codeliste führt, beinhaltet die Angabe der vollständigen Organisationsbezeichnung (Behörde, Unternehmen etc.) und sollte ggf. mit dem entsprechenden Raumbezug (z. B. Bundesland) angegeben werden. Wünschenswert ist die zusätzliche Angabe des Akronyms der Bezeichnung in Klammern hinter dem ausgeschriebenen Organisationsnamen. Sofern gewünscht, können die Fachabteilung / das Referat, die (zusätzliche) Angabe des räumlichen Zuständigkeitsbereichs / der Verwaltungseinheit (z.B. Bundesland) beigefügt werden.

Die Beschreibung kann, sofern gewünscht, weitere Funktionen erfüllen, die beim Verfassen des Textes mit zu beachten sind. Beispielsweise ist hier denkbar, dass der Inhalt der Kurzbeschreibung automatisiert für einen Internetauftritt oder eine Produktpräsentation genutzt wird.

(Quelle: Checkliste: Fachliche Konventionen (Semantik) für Metadaten des GDI-DE AK Metadaten; inhaltlich übernommen und angepasst an die Erfordernisse einer Codelistenbeschreibung)

muss
2

Codelisten sollen eine fachliche Einheit bilden. Sie beschreibt genau ein fachliches Thema. Das Thema ist in Klassen / Codes untergliedert und kann hierarchische Abhängigkeiten beinhalten, wenn dadurch der abzubildende Sachverhalt noch genauer beschrieben werden kann.

Beispiel: Liste für Kulturarten in der Landwirtschaft (100=Weizen, 200=Gerste, 201=Sommergerste, 202=Wintergerste, 300=Hafer usw.)

muss
3

Ein Code muss innerhalb der Codeliste nicht nur einzigartig sondern auch klar unterscheidbar sein. Grundsätzlich gibt es zwei unterschiedliche Zielgruppen für Codes:

  1. Code für eine direkte Interpretation durch den Menschen
  2. Code für eine maschinelle Interpretation bzw. die automatisierte Auswertung

Menschen bevorzugen "sprechende" Codes oder abstrakte Codes mit einer sehr begrenzten Zeichenlänge von bis zu maximal 3 oder 4. Sprechende oder besonders einfache Codes bergen jedoch die Gefahr, dass sie dennoch nicht passgenau unterschieden werden können und / oder für Fachfremde weiterhin unverständlich sind. Diesen Codes stehen daher Codes für die automatisierte Auswertung gegenüber. Hier wird davon ausgegangen, dass ohne Hinzuziehen der Codeliste, ohnehin die Fachlichkeit nicht von einem Menschen analysiert werden kann.

Beide Code-Varianten stehen grundsätzlich gleichrangig nebeneinander und sind abhängig davon, wie die mit ihnen beschriebenen Daten üblicherweise weiterverarbeitet werden. Vor dem Erstellen einer Codeliste ist daher diejenige Variante zu wählen, die fachlich zielführend ist.

Bei bestehenden Codelisten, die lediglich ergänzt werden sollen, sollten weitere Codes im bisherigen Stil angefügt werden, sofern nicht eine komplett neue Codeliste aufgebaut werden muss. Werden alte Codes durch neue ersetzt, sollten in zeitlich neueren Versionen der Codeliste keine bereits stillgelegten Codes erneut in einem anderen Kontext verwendet werden. Es sind stets neue Codes für neue fachliche Klassen zu bevorzugen.


4Codes haben technisch gesehen keine gesonderte fachliche Bedeutung. Um sie zu entschlüsseln wird eine Codeliste benötigt, mit der die Daten inhaltlich erschlossen werden. Aus diesem Grunde ist eine Schreibweise für Codes zu bevorzugen, die eine nur geringe Fehleranfälligkeit aufweist, wenn sie von einem Menschen angewendet wird. Hilfreich ist in diesem Zusammenhang das Verwenden von Zahlenwerten. Werden Zeichen verwendet, so sind jene Zeichen zu bevorzugen, die leicht visuell voneinander unterschieden werden können. Grundsätzlich sind kurze Codes besser geeignet als lange Codes. Sonderzeichen dürfen nicht verwendet werden. Eine Reduzierung auf den Zeichensatz ASCII ist zu favorisieren. Bei der Benutzung von Groß- und Kleinbuchstaben ist in Betracht zu ziehen, dass diese nicht von allen Betriebssystemen standardmäßig überhaupt unterschieden werden können.
5

Über vollständig aussagekräftige Codelisten kann die Suche nach geeigneten Daten durch Künstliche Intelligenz (KI) verbessert werden. Die KI kann so erschließen, welches Thema inhaltlich mit dieser Codeliste behandelt wird.

Die Codelisten ergänzen die speziell für Menschen gemachten ISO-Metadaten im Sinne einer GDI. ISO-Metadaten müssen ohnehin verpflichtend bereitgestellt werden. Sie sind die Basis für eine semantische Suche nach Geodaten, denn über die ISO-Metadaten lassen sich die verwendeten Datenschemata erschließen, die wiederum eine Aussage über die verwendeten Codelisten beinhalten. Codelisten sind semantisch durchsuchbar.


6

Jeder Code benötigt eine eindeutige fachliche Beschreibung derjenigen Sache, die er beschreibt (Feld "Definition" wird zum Pflichtattribut).

  • code
  • name
  • ...
  • definition (Pflichtfeld, ggf. als ganzer Satz bzw. nach Nr. 1 oder auch als Auszug aus der korrekten fachlichen Grundlage zum Erstellen dieser Codeliste)
  • description (Pflichtfeld)

7

Für international bedeutende Codes sollten auch Übersetzungen in andere Sprachen in Betracht gezogen werden. Fachthemen können nur von Fach-Communities übersetzt werden, nicht von Dolmetschenden. Begrüßenswert ist in jedem Falle ein Vorschlag für die englische Übersetzung.

Prüfen: Ist das sogar Pflicht für die INSPIRE-Codes zur Erweiterung bestehender Codelisten? - Einfluss der HVD-DVO? Wenn HVD in die Nutzung gebracht werden sollen, dann werden die Übersetzungen auch für originäre Daten benötigt.


8

Codes können und sollten eine hierarchische Gliederung besitzen. Diese kann besonders gut semantisch ausgewertet werden und dient einer verbesserten Auffindbarkeit der Daten in einer Semantic-Web-Umgebung.

Beispiel aufzeigen / verlinken (Staatliche Geologische Dienste)


9

Codes dürfen ausschließlich aus ASCII-Zeichen bestehen.

Gibt es dafür nicht schon eine Vorgabe??

Muss es Bestandsschutz für in der Nutzung stehenden Codes geben? Wahrscheinlich ja. Oder: Soll generell bei einer Aktualisierung von Codes oder einer Codeliste eine Vorgänger / Nachfolger-Regelung für Codes mit Hilfe der Registry geschaffen werden, die dazu führt, dass in relativ kurzer Zeit alte Codelisten nach den neuen Kriterien geführt werden?


10Die Versionierung von Codelisten / Codes ist verpflichtend zu führen.muss

>> müsste von der Software geprüft gehen, soweit wie möglich...

...