Overzicht van de data kwaliteiten en daarbij een aantal maatregelen die genomen kunnen worden om een Data kwaliteit met behulp van deze maatregelen (binnen een release) op een hoger niveau te krijgen.
Versie | 1.0 | Creatie datum | 22-06-2022 |
Dit is de situatie waarbij verwijzingen vanuit de ene data entiteit altijd correct verwijzen naar de gerelateerde data entiteiten.
Pas repositories en registries toe als er gewerkt wordt met een gegevensopslag die het gebruik van sleutels minder goed ondersteunt. Denk bijvoorbeeld aan het ontsluiten van diverse soorten van bestanden waarbij de bestandsnaam als sleutel wordt gebruikt of waarbij de sleutel door precisieproblemen niet gelijk blijven.
Inzet van protocollen. Denk hierbij bijvoorbeeld aan WS-reliable messaging dat kan zorgdragen voor het compleet afleveren van een gegevensset, het zorgdragen voor de juiste volgorde van de pakketten na ontvangst en dergelijke. Dit soort protocollen kunnen zorgdragen voor een voldoende hoge integriteit
Met name rond toepassingsgebied overstijgende sleutels dient het beheer en eigenaarschap ingeregeld te worden. Enerzijds bij het selecteren en beschrijven van deze sleutels, anderzijds bij het bewaken van het gebruik van deze sleutels binnen projecten waar deze sleutels ingezet dienen te worden. Het is een logische keuze deze bewaking binnen de taken van de data-architect te beleggen.
Beschrijven en toepassen van patronen voor sleutel identificatie en het afdwingen van referentiele integriteit. Zoals het uitbreiden van interne sleutels met een unieke applicatiesleutel of het toepassen van GUID’s e.d. Pas deze patronen toe binnen zowel de datawarehouse als de operational datastore omgeving toe.
Inzet sleutelkasten, in een aantal gevallen kunnen bij de data integratie de gegevens van een gegevensset verrijkt worden met verwijzingen naar referentiele sleutels zoals die toegepast worden op andere plaatsen binnen de organisatie. Hiermee kan dan op eenvoudige wijze herleidt worden welke identificerende sleutel waar toegepast kan worden. Sleutelkasten worden veelal beschreven binnen de architectuur in samenspraak met de eigenaren van de verschillende registers.
Bepaal de eisen voor referentiele integriteit en kies op basis daarvan het opslagplatform. Richt dit platform op dusdanige wijze in dat de referentiele integriteit maximaal wordt gerealiseerd. Dus als er constraints mogelijk zijn richt deze ook in.
Werk eventueel met toepassingsgebied overstijgende sleutels voor het afdwingen van referentiele integriteit. Bijvoorbeeld bij service oriëntatie of keten integratie over de grenzen van een applicatie of organisatie heen. Hierbij kan de inzet van een sleutelkast component of service uitkomst bieden
Inrichten integratievorm, bij verschillende vormen van integratievormen kan de wijze van inrichting een negatief effect hebben op de referentiele integriteit. Bijvoorbeeld bij integratie op basis van berichten kunnen aanvullende eisen gesteld worden aan de in te zetten componenten, verbindingen en protocollen. Bij de inzet van generieke integratievoorziening dient rekening gehouden te werken met de strengste eisen van integriteit zoals deze binnen deze voorziening ingezet zal worden.
De technische voorzieningen moeten voldoende oplossingen te hebben voor het handhaven van referentiele integriteit. Denk bijvoorbeeld aan voorzieningen als het genereren van unieke sleutels het werken met transacties en rollback mechanismen. Met name in een sterk gedistribueerde omgeving zoals een SOA omgeving is dit een uitdaging.
Componenten binnen een applicatie dienen tijdens het gebruik rekening te houden met de referentiele integriteit van de gegevens. Dat betekent dat voldoende uniek identificerende gegevens getoond moeten worden, maar ook dat bijvoorbeeld sleutels tijdens bewerkingssessies onzichtbaar gehandhaafd worden.
Primary en foreign keys maken het mogelijk om controles uit te voeren op de sleutels (primaire) in een tabel en vervolgens de verwijzingen vanuit andere tabellen naar deze primaire sleutel af te dwingen. Hiermee voorkom je verwijzigingen die niet correct zijn in een goed geconfigureerde database
Applicatie of organisatie overstijgende sleutels, bij data integratie kan een sleutel vanuit een bronsysteem onvoldoende uniek zijn. Zeker in het geval waar bijvoorbeeld gegevensset gecombineerd worden met andere sets kunnen aanvullende maatregelen noodzakelijk zijn. In die gevallen kan het benoemen van sleutels met voldoende uniekheid vanuit architectuur of de eigenaar van gegevenssets noodzakelijk zijn. Denk bijvoorbeeld aan het BSN en KvK nummer als organisatie overstijgende sleutel.