Címek, személyek modellezése Data Vault-ban

Jó egy éve sokat foglalkoztam a Data Vault adattárház adatmodellezéssel, és anno felírtam magamnak kérdésként, hogy hogyan érdemes az üzleti kulcsok nélküli entitásokat modellezni a Data Vault-ban.  Akkor nem tudtam rá a választ, de visszafejtve Linstedt egy demó adatmodelljét azt láttam, hogy ő satellite táblákba teszi ezeket az entitásokat (tipikusan cím, személyek). Ez azonban első körben annyira nem tetszett…

Most utánamentem, megtaláltam a Sticky Areas, Sweet Solutions in Data Vault Modeling című cikket, és ennek kapcsán leírom a megoldási lehetőségeket ide:

Ezeknek az információknak központi törzsadatkezelőben a helye, ott kell neki adni egy üzlet kulcsot, amit aztán széles körben használunk a vállalatnál és az adattárházban (A kulcs nem lehet egy automatikusan növő futó sorszám, hiszen a törzsadatkezelőnek, vagy a tisztító programnak mindig ugyanazt a kulcsot kell kiosztania akkor is, ha elpusztul az adatbázis, újra kell tenni a gépet, stb. (jelöltek lehetnek pl. Északi szélesség, keleti hosszúság, tengerszint feletti magasság, más adattisztító cégek referencia adatbázisaikban használt kulcsok, stb.)

Ha megvan ez a kulcs, akkor azt használhatjuk természetes kulcsként és építhetünk belőle HUB táblát

töltsük Satellite táblákba a kulcs nélküli entitásokat

Menjenek ezek az információk satelit táblákba és „same as” link táblák segítségével próbáljuk meg tisztítani őket az adattárház egy magasabb rétegén belül. Ezt ismerjük, csak ez nem tetszett első körben annyira…

Keressük meg a természetes kulcsot

A személyeknek van természetes kulcsuk (személyi szám, adószám) vagy más olyan kulcsuk, amivel azonosíthatjuk őket. Keressük meg és használjuk azt. Ebben az esetben újra lesz természetes kulcsunk, amit használhatnunk HUB táblákban

Összességében:Nincs új a nap alatt. Sajnos mind az MDM-es, mind a „keressük meg a kulcsát” megoldás inkább csak elméleti jellegű. Ki kell tenni őket satellite táblákba és „same as” link táblákkal kell egységesíteni őket az adattárház egy magasabb rétegében. Sajnos csak ez van.

 

Kővári Attila - BI projekt

hozzászólás

Szia Attila! Két megjegyzés: 1. Data Vault? :) 2. Érdemes megnézni a cikkhez kapcsolódó kérdéseket és válaszokat is. Ott részletesebben is kifejti Dan, hogy mire gondolt. Üdv, Gábor

Új hozzászólás