Overzicht van de data kwaliteiten en daarbij een aantal maatregelen die genomen kunnen worden om een Data kwaliteit met behulp van deze maatregelen (binnen een release) op een hoger niveau te krijgen.
Versie | 1.0 | Creatie datum | 22-06-2022 |
Uniekheid van een data entiteit is gericht op het feit dat er geen andere entiteiten zijn met dezelfde gegevens. Ook bekend als duplicaten probleem.
Signaleren van duplicaten in sleutels en in combinaties van attributen in dataobjecten.
Richt processen in voor eigenaarschap en beheer zodat bij nieuwe ontwikkelingen besluitvorming en inrichting eenvoudig gefaciliteerd kunnen worden.
Beschrijf wat de (unieke) bron is van gegevensentiteiten en de afnemers zijn. Neem daarbij mee wat de actualiteitsbehoefte is van de verschillende afnemers is en richt de beheerprocessen van het bronsysteem hierop in.
Draag zorg voor een toetsingsmechanisme voor de uniekheid van entiteiten. Maak iemand verantwoordelijk voor deze uniekheidstoetsing van entiteiten. Kies in eerste instantie voor toetsing van de bedrijfsobjecten en bepaal in welke applicatiefuncties deze entiteiten worden beheerd en gebruikt.
Houdt bij het selecteren van bijvoorbeeld standaardapplicaties rekening met het feit dat delen van de gegevens die gebruikt kunnen worden uit een andere bron kunnen komen. Bijvoorbeeld door het gebruik van een service interface. Veel applicaties zijn hierop niet ingericht waardoor replicatie noodzakelijk wordt.
Unieke indexen aanleggen kan worden gedaan op basis van de sleutel (de primary keys bijvoorbeeld). Echter als je dat zou willen dan kan dat ook op een combinatie van kolommen voor extra duplicatie validatie checks
Benoem authentieke en kernregisters die aangewezen worden voor de opslag van bedrijfsobjecten en ontsluit deze via een gestandaardiseerde interface op basis van views en/of services.
Pas naamgevingsconventies toe voor entiteiten, attributen en relaties waardoor de kans op het ontstaan van dubbele opslag in registers verkleind wordt.
Bij het gebruik van gegevens wordt er soms voor gekozen, bijvoorbeeld vanuit performance overwegingen om gegevens tijdelijk op te slaan in een geheugen of op een andere locatie. Dit brengt risico’s met zich mee op het vlak van uniekheid op het moment dat de brongegevens wijzigen en dit niet wordt doorgevoerd binnen de replica’s. Dit wordt bewaakt binnen governance.
Zet registers en/of repositories in de beschrijving van entiteiten. Hiermee worden projecten en beheerprocessen gefaciliteerd in situaties waar herbruikbaarheid van gegevensdefinities relevant zijn.
Zet technische hulpmiddelen in die uniekheid afdwingen, denk hierbij bijvoorbeeld aan relationele databases met voorzieningen als primaire sleutels en clustered indexen.