Mit historizáljunk az adattárházban?
Milyen adatváltozásokat akarunk nyomon követni az adattárházban? Vagy egyszerűbben kérdezve: Mit historizáljunk? Mindent nyomjuk rá a választ csípőből. Minden adatváltozást nyomon akarunk követni, ettől lesz auditálható az adattárház. És ez így igaz.
De tényleg minden adatváltozást nyomon kell követnünk? Azt is ha valaki rosszul rögzített egy adatot amit aztán javított? Azt is ha valamit rosszul számolt a forrásrendszer egy hiba miatt, majd ez javításra került? Azt is ha a DWH betöltése csak sokkal később vett észre egy változást, mint ahogy az bekövetkezett?
By definíció a historizáció célja az üzleti események változásának nyomonkövetése. Egy adatrögzítési vagy forrásrendszeri hiba javítása üzleti esemény? Nem. Ergo nem kéne nyomon követnünk. Ha megváltozik egy szerződés státusza, akkor az egy üzleti esemény, de ha egy forrásrendszeri hiba miatt a korábbi téves státuszt billentünk át a jó státuszra akkor az már nem az. A forrásrendszeri hiba miatti adatjavítás ugyanis nem üzleti esemény. Az elemzők pedig a valóságot akarják látni, nem egy naplót a valóság korábban hitt állapotáról...
Ugyanakkor a felügyelet, a tulajdonosok, a felső vezetők azt várják el tőlünk hogy ugyanazt a számot jelentsük ma is tavalyi forgalomról, mint amit az előző hónapban egyszer már jelentettük. Vagy másképpen fogalmazva: Ha megkérdezik hogy mennyi volt a tavalyi forgalom, akkor meg tudjuk nekik mondani hogy mit mondtunk róla a múlt hónapban. Ehhez viszont tárolnunk kell a forrásrendszeri hiba miatt tévesen jelentett számot is.
Összefoglalva: Sajnos a legtöbb esetben nem elég az üzleti események változását nyomon követnünk. Ha a hibás adatokból készült már jelentés, akkor tárolnunk kell minden téves rögzítést, minden forrásrendszeri vagy extraktálási hibát és cipelnünk kell a múltat, annak összes bűnével együtt...
Kővári Attila - BI projekt
Új hozzászólás