Fájl alapú interfészek előnyei

Kérdés: Hogyan etessük az adattárházat? Közvetlenül a forrásrendszerből, vagy közvetve, interfész fájlokon keresztül?

A közvetlen lekérdezés lehetőségének van számos előnye: Nem kell hozzá külső segítség, az adattárház fejlesztője közvetlenül le tudja kérdezni a forrásrendszert, ezáltal csökken a függőség, stb. Egyszóval kényelmesebb, egyszerűbb, gyorsabb és olcsóbb közvetlenül a forrásrendszerekből dolgozni, mint interfészfájlokon keresztül.

Sokszor azonban feladjuk ezt a kényelmet, és elindulunk az interfészfájlokon keresztüli kommunikáció rögös, kockázatos és költséges útján... 

Jellemzően akkor használunk interfész fájlokat, ha

  1. Az adattárház fejlesztő nem dolgozhat éles forrásadatokkal, és a forrásrendszernek nincs olyan fejlesztői-, vagy tesztkörnyezete, amire ráengedhetjük az adattárház fejlesztőket.
  2. A fejlesztő csak anonimizált adatokkal dolgozhat, és nincs a forrásrendszereknek olyan környezete, ahol az adatok anonimizáltak
  3. Semmit sem érünk a nyers táblákkal, mert az üzleti logikát a forrásrendszer fejlesztői az alkalmazásba fejlesztették bele, és az adatbázis csak a nyers adatokat tartalmazza.
  4. Nem akarunk plusz licenszdíjat fizetni interfész adatbázisokért, anonimizált vagy tesztadatokkal feltöltött forrásrendszeri környezetekért.
  5. Nem akarunk függeni a forrásrendszeri fejlesztői- és tesztkörnyezetek változásaitól, fejlesztés közbeni adattörléseiktől, szerkezetváltozásuktól, back-upból történő visszaállításuktól, leállásaiktól, stb.
  6. Technológiai korlátja van a forrásrendszer elérésnek (mert pl nem létezik connector a forrásrendszerhez, nincs interfésze a forrásrendszernek, elérhetetlen szigetrendszerként működik a forrásrendszer, stb.)
  7. Jogi problémák miatt nem férhet hozzá az adattárház szállító a forrásrendszerhez
  8. Nagy adatmennyiséggel kell dolgoznunk és a közvetlen integráció sebességét messze túlszárnyalja a txt-be exportálás majd onnan importálás sebessége.
  9. stb.

Összefoglalva: Egy ideális világban a forrásrendszereknek van anonimizált, folyamatosan frissülő tesztkörnyezete, a forrásrendszer szállítók mindent megtesznek, hogy az adataikhoz könnyen hozzáférjenek más rendszerek, a gyártók nem barikádozzák körbe magukat jogilag és technológiailag, hogy távol tartsák magukat az intergrációra törekvő harmadik partnerektől. Egy ideális világban működik a közvetlen adatkapcsolat a forrásrendszerek és az adattárházak között, de nem ideális világban sokszor szükség van a dobbantásra, és először ki kell tenni a forrásrendszer adatait interfészállományokba és csak onnan tudjuk beolvasni az adattárházba.

 

Kővári Attila - BI projekt

BI & DWH projektvezető képzés

Tudjon meg többet az itt elhangzottakról! Jöjjön el a 2023. szeptember 28.-i BI és adattárház projektvezető képzésre, vagy rendeljen kihelyezett tanfolyamot! Részletek >>

 

Új hozzászólás