Blijf op de hoogte!
Gegevens worden toenemend beschouwd als belangrijke assets, waar organisaties expliciet aandacht aan moeten besteden. Daarbij is ook aandacht voor de kwaliteit van deze gegevens en het toevoegen van metagegevens essentieel. Zo is het bijvoorbeeld belangrijk om te kunnen begrijpen wat de herkomst is van gegevens. Het geeft een belangrijke indicatie van de kwaliteit van gegevens en bepaalt daarmee voor een belangrijk deel het vertrouwen dat gebruikers in de gegevens hebben. De herkomst van gegevens kan op allerlei niveaus in metagegevens zijn vastgelegd. De basis is dat in de metagegevens van een dataset duidelijk is welke organisatie de gegevens gecreëerd heeft. Voor individuele gegevens kan bijvoorbeeld relevante context zijn welke specifieke persoon ze heeft gecreëerd, op welk moment, naar aanleiding van welke gebeurtenis en als onderdeel van welke activiteit. Onderstaande figuur geeft een overzicht van de soorten metagegevens die relevant zijn.
Voor informatieproducten geldt dat zij zijn afgeleid van brongegevens middels een transformatie. Gebruikers willen weten welke bronnen en afleidingsregels gebruikt zijn. De gebruikte bronnen moeten dan zijn beschreven in de metagegevens van het informatieproduct en de afleidingsregels moeten op te vragen zijn door gebruikers. Het liefst hebben gebruikers ook inzicht in de gebruikte brongegevens. Ze willen dat inzichtelijk hebben bij individuele gegevens in een rapport of dashboard waar ze naar kijken. Idealiter is de volledige keten inzichtelijk, van inwinning, via bewerkingen en transformaties tot op wat op een scherm zichtbaar is. Of dat ook echt noodzakelijk en haalbaar is zal in een individuele context moeten worden bepaald. Als niet de gehele keten inzichtelijk is bij een informatieproduct, dan zouden afleidingsregels in ieder geval in alle schakels van de keten moeten kunnen worden opgevraagd.
Er zijn gelukkig allerlei standaarden die gebruikt kunnen worden om metagegevens over herkomst vast te leggen. De PROV standaard is specifiek gericht op het vastleggen van herkomst en wordt bijvoorbeeld ook gebruikt binnen de DCAT standaard. Het maakt het mogelijk om gedetailleerd vast te leggen wie, wat, wanneer, welke gegevens heeft gecreëerd en welke brongegevens en afleidingsregels daaraan ten grondslag lagen. De PROV standaard is een Linked Data vocabulaire en maakt het daarmee mogelijk om dit soort informatie over herkomst, ook direct bij de gegevens zelf vast te leggen. Een andere standaard die het mogelijk maakt om informatie over herkomst vast te leggen is de Dublin Core standaard (ook bekend als ISO 15836), die meer uit de hoek van web content vandaan komt. Deze is tevens beschikbaar als Linked Data vocabulaire, en biedt een standaard classificatie van soorten betrokkenen bij de totstandkoming van gegevens. Ook de MDTO standaard, die gericht is op het duurzaam toegankelijk maken van informatie-objecten, heeft een uitgebreide invulling van gegevens over herkomst.
In de context van de hernieuwde eIDAS verordening zal er een European Digital Identity Wallet beschikbaar komen. Hierin kunnen gebruikers verifieerbare verklaringen plaatsen van allerlei partijen, die ze vervolgens kunnen verstrekken aan dienstverleners. Een verifieerbare verklaring is eigenlijk een bewijs dat gegevens afkomstig zijn van een bepaalde partij. Het zegt daarmee dus ook iets over de herkomst van gegevens. Het zal hierdoor toenemend belangrijk worden voor organisaties om verifieerbare verklaringen te kunnen leveren. In meer algemene zin is het leveren van een meer formeel bewijs van de herkomst van gegevens waardevol. Het geeft afnemers een bepaald vertrouwen in het gegeven en de herkomst. Dit opent dus nieuwe mogelijkheden om ook andere gegevens die worden uitgewisseld te voorzien van meer informatie over herkomst. Het verhoogt de betrouwbaarheid van uitgewisselde gegevens.
Bovenstaande is gebaseerd op de GDI domeinarchitectuur gegevensuitwisseling, die ik vanuit bureau MIDO van het ministerie van BZK, samen met architecten van een aantal andere overheidsorganisaties heb opgesteld. Deze architectuur is inmiddels vastgesteld en publiek beschikbaar. We werken op dit moment ook aan een domeinarchitectuur toegang, die je ook on-line kunt volgen.
Neem contact op met ons, we vertellen er graag meer over!
Blijf op de hoogte!
Arnhemse Bovenweg 140
3708 AH Zeist
Nederland
© ArchiXL | KvK 05084421