Fájl alapú interfészek előnyei
Kérdés: Hogyan etessük az adattárházat? Közvetlenül a forrásrendszerből, vagy közvetve, interfész fájlokon keresztül?
A közvetlen lekérdezés lehetőségének van számos előnye: Nem kell hozzá külső segítség, az adattárház fejlesztője közvetlenül le tudja kérdezni a forrásrendszert, ezáltal csökken a függőség, stb. Egyszóval kényelmesebb, egyszerűbb, gyorsabb és olcsóbb közvetlenül a forrásrendszerekből dolgozni, mint interfészfájlokon keresztül.
Sokszor azonban feladjuk ezt a kényelmet, és elindulunk az interfészfájlokon keresztüli kommunikáció rögös, kockázatos és költséges útján...
Jellemzően akkor használunk interfész fájlokat, ha
- Az adattárház fejlesztő nem dolgozhat éles forrásadatokkal, és a forrásrendszernek nincs olyan fejlesztői-, vagy tesztkörnyezete, amire ráengedhetjük az adattárház fejlesztőket.
- A fejlesztő csak anonimizált adatokkal dolgozhat, és nincs a forrásrendszereknek olyan környezete, ahol az adatok anonimizáltak
- Semmit sem érünk a nyers táblákkal, mert az üzleti logikát a forrásrendszer fejlesztői az alkalmazásba fejlesztették bele, és az adatbázis csak a nyers adatokat tartalmazza.
- Nem akarunk plusz licenszdíjat fizetni interfész adatbázisokért, anonimizált vagy tesztadatokkal feltöltött forrásrendszeri környezetekért.
- Nem akarunk függeni a forrásrendszeri fejlesztői- és tesztkörnyezetek változásaitól, fejlesztés közbeni adattörléseiktől, szerkezetváltozásuktól, back-upból történő visszaállításuktól, leállásaiktól, stb.
- Technológiai korlátja van a forrásrendszer elérésnek (mert pl nem létezik connector a forrásrendszerhez, nincs interfésze a forrásrendszernek, elérhetetlen szigetrendszerként működik a forrásrendszer, stb.)
- Jogi problémák miatt nem férhet hozzá az adattárház szállító a forrásrendszerhez
- Nagy adatmennyiséggel kell dolgoznunk és a közvetlen integráció sebességét messze túlszárnyalja a txt-be exportálás majd onnan importálás sebessége.
- stb.
Összefoglalva: Egy ideális világban a forrásrendszereknek van anonimizált, folyamatosan frissülő tesztkörnyezete, a forrásrendszer szállítók mindent megtesznek, hogy az adataikhoz könnyen hozzáférjenek más rendszerek, a gyártók nem barikádozzák körbe magukat jogilag és technológiailag, hogy távol tartsák magukat az intergrációra törekvő harmadik partnerektől. Egy ideális világban működik a közvetlen adatkapcsolat a forrásrendszerek és az adattárházak között, de nem ideális világban sokszor szükség van a dobbantásra, és először ki kell tenni a forrásrendszer adatait interfészállományokba és csak onnan tudjuk beolvasni az adattárházba.
Kővári Attila - BI projekt
BI & DWH projektvezető képzés
Tudjon meg többet az itt elhangzottakról! Jöjjön el a 2023. szeptember 28.-i BI és adattárház projektvezető képzésre, vagy rendeljen kihelyezett tanfolyamot! Részletek >>
Új hozzászólás