06-12-2020

Hoeders van thesauri, verenigt U!

De term "thesaurus" betekent "naslagwerk" en is een van oorsprong Griekse term. Een thesaurus is een gestructureerde lijst van begripsdefinities, die vooral symbool staan voor objecten in de werkelijkheid.

In een thesaurus worden begrippen ook aan elkaar gerelateerd. Zo kunnen bijvoorbeeld de volgende relaties met andere begrippen worden gelegd:

  • synoniem: een ander woord met zelfde betekenis (bijvoorbeeld "brug" als ander woord voor "aquaduct");
  • hyperoniem: een woord met een ruimere / bredere betekenis (bijvoorbeeld "kunstwerk" als ruimer begrip dan "brug");
  • hyponiem: een woord met een engere / smallere betekenis (bijvoorbeeld "snelweg" als enger begrip dan "weg");
  • antoniem: een woord met een tegengestelde betekenis (bijvoorbeeld "zwart" als tegengesteld begrip voor "wit");
  • verwant begrip: een woord dat op een andere wijze gerelateerd is (bijvoorbeeld "pomp" als begrip dat is gerelateerd aan het begrip "gemaal");

Eén van de oudste bekende voorbeelden begripsdefinities stamt uit het jaar 196 voor Christus: de steen van Rosetta. Hierop staat één tekst geschreven op drie verschillende manieren (in 2 talen):

  • Hiërogliefen (Egyptisch)
  • Demotisch schrift (Egyptisch)
  • Grieks

De tekst is een dankbetuiging van de priesters van Memphis aan koning Ptolemaeus V Epiphanes. De steen is ontdekt in 1799 bij de Egyptische plaats Rosetta door Franse troepen en heeft een sleutelrol gespeeld bij het ontcijferen van het hiërogliefenschrift. Kunnen we deze historische wijsheden hergebruiken en vertalen naar de moderne technieken van deze tijd? Wij denken van wel.

Met BegrippenXL introduceren we als ArchiXL een digitale steen van Rosetta. Het verbindt thesauri die op basis van de SKOS standaard (Simple Knowledge Organization System) zijn beschreven. Hierdoor kunnen begrippen uit verschillende perspectieven en werkelijkheden aan elkaar verbonden worden. Het maakt het ook mogelijk om deze samenhang visueel inzichtelijk te maken. Een voorbeeld hiervan is weergegeven in onderstaand figuur en is direct toegankelijk via https://www.begrippenxl.nl/graph.php?zoekterm=brug.

Onderstaand figuur laat zien hoe de term “brug” in verschillende thesauri en lijsten van datadefinities is gedefinieerd, zoals in:

  • CHT: de Cultureel Heritage (Erfgoed) Thesaurus
  • EuroVoc: de meertalige en multidisciplinaire thesaurus van de EU. Het bevat trefwoorden op 21 domeinen en 127 subdomeinen waarmee de inhoud van documenten in EUR-Lex wordt beschreven.
  • CBS: de begrippenlijst van het Centraal Bureau voor Statistiek
  • IMGeo: de catalogus van begrippen met betrekking tot grootschalige topografie zoals beheerd door het ministerie van I en W.
  • Aquo: de begrippenlijst voor de watersector die wordt beheerd door Informatiehuis Water
  • IMWA: het Informatiemodel Water dat wordt gebruikt voor de uitwisseling van geografische gegevens in het waterbeheer.
  • DAMO: een gestandaardiseerde datamodel voor de watersysteemgegevens van de waterschappen.
  • HEA: een datamodel voor watersysteemgegevens gebruikt door het waterschap Hunze & Aa’s.

De samenhang van de definities wordt als netwerk zichtbaar gemaakt. Het laat gerelateerde en bredere begrippen zien in verschillende definitielijsten. Je ziet hierdoor ook verschillende manieren om begrippen te definiëren, zoals in enkelvoud of meervoud en met of zonder hoofdletter of niet. Meer eenduidigheid en afspraken over naamgevingsconventies zou helpen (en daar kunnen wij natuurlijk in ondersteunen). De in de genoemde thesauri en definitielijsten komen met name uit de watersector, maar zijn uiteraard ook goed denkbaar voor andere sectoren.

Hoe kun je hier als organisatie nu praktisch mee aan de slag? Het belangrijkste is het verzamelen, harmoniseren en verfijnen van begrippen (termen en hun definitie). Daarnaast is het belangrijk om afspraken te maken over rollen, taken en verantwoordelijkheden. Een goede data governance is randvoorwaardelijk voor het laten werken van thesauri. Het is ook de basis voor datamanagement in meer algemene zin. De essentie is dat mensen structureel met elkaar in gesprek zijn en komen tot gemeenschappelijke begripsvorming. Het zorgt daarmee ook voor het delen van kennis, die te vaak in de hoofden van individuen blijft. Kennis delen is vermenigvuldigen en op lange termijn meer duurzaam. Daarom een soortgelijke oproep als Karl Marx (1818 – 1883) en Friedrich Engels deden in 1848 met het Communistisch Manifest, door kennis met elkaar te delen gaan we werelden verbinden met als doel elkaar ook beter te begrijpen:

“Hoeders van thesauri hebben daarbij niets dan ketenen te verliezen. Zij hebben een wereld te winnen. Hoeders van thesauri, verenigt U!”.

Jan Willem van Veen (jwvveen@archixl.nl) is principal consultant bij ArchiXL.

Interessant? Deel het!
Illustratie stel je vraag
Meer weten over deze blog?

Neem contact op met ons, we vertellen er graag meer over!

© ArchiXL  |  Chamber of Commerce  05084421