Dilemma

Az elmúlt tizenx évben minden csillagsémás adattárházra építettünk OLAP adatkockákat. Sőt. Inkább fordítva. Minden OLAP kocka alá építettünk egy csillagsémás adatpiacot:-)

Az OLAP adatbázis-kezelő alkalmazása nem is volt kérdés, hiszen

  1. ismerjük az OLAP adatbázis-kezelők előnyeit
  2. és tudjuk azt is, hogy az OLAP adatbázis-kezelő Microsoftos környezetben ingyen van (része az SQL Server programcsomagnak)

Eddig tehát tiszta volt a kép: OLAPot használtunk a lekérdezések gyorsítására. Csakhogy az SQL Server 2012 megjelenésétől kezdve szélesedik majd a paletta és az OLAP mellett már választhatjuk a PowerPivotból megismert oszlopalapú, memóriában futó adatbázis-kezelőt is akár adatok, akár indexek tárolására.

Mindezek következményeképpen 4 lehetőségünk is lesz döntéstámogató rendszer építésére. Ezek:

  1. Többdimenziós OLAP
  2. Oszlopalapú, memóriában futó adatbázis-kezelő (Vertipack)
  3. Relációs csillagséma oszlopalapú indexekkel a memóriában
  4. Relációs csillagséma oszlopalapú indexekkel a memóriában tetején ROLAP kockákkal

Háát nem lesz könnyű választani. Technikai oldalról vizsgálva az OLAP és az oszlopalapú modell nagyon sok hasonlóságot mutat. Ugyanaz a probléma - ha most még nem is - de néhány év múlva nagyon nagy valószínűséggel meg lesz oldható mindkét technológiával. Persze lesznek olyan esetek, amikor az egyik technológia szignifikánsan jobb eredményt ad, mint a másik. Egy ilyenbe már mi is belefutottunk és az ügyfelemmel úgy döntöttünk, hogy az OLAP mellett használni fogjuk a PowerPivotot is.

De nagy általánosságban mégis azt mondom, hogy a két eszköz közti különbségek egyre kisebbek lesznek, és magyarországi méretekben gondolkodva hamarosan mindkét technológiával jól teljesítő döntéstámogató rendszert fogunk tudni építeni.

A kérdés tehát továbbra is az, hogy melyik technológiát használjuk. Ha csak egyet választhatnánk, akkor mérlegelni kéne, hogy

  • Alkalmas-e az adott technológia az összes problémánk megoldására?
  • Vajon x év múlva melyik technológiát fogja leginkább favorizálni a Microsoft? Melyik technológia továbbfejlesztésére áldoz majd többet?
  • Melyik technológiába érdemes tudást fektetnünk?
  • Melyik technológiához találunk szakembert?
  • A megjelenő új termékek mely technológiát fogják támogatni?
  • Vajon x év múlva milyen lesz a vállalatunk elemzési, monitorozási kultúrája? El fog-e terjedni az önkiszolgáló üzleti intelligencia? Vagy marad a klasszikus kiszolgáló üzleti intelligencia?
  • Vajon x év múlva az ad-hoc lekérdezések készítésére OLAP technológiát fogunk használni? Vagy most már, hogy lehetőség lesz a relációs csillagséma gyors lekérdezésére T-SQL utasításokkal inkább használunk valamilyen relációs riportkészítő eszközt?
  • stb.

Persze nem biztos, hogy egy eszközt kell választani. Sőt. Valószínűleg a több eszköz kombinációjából összeállított döntéstámogató rendszer összességében jobb lesz, mintha csak egyik vagy csak a másik technológiát használnánk. De a több eszköz használatának ára van: Több eszközt kell üzemeltetni, több eszközből kell kompetenciát építeni, stb.

Azt azonban, hogy milyen magas ez az ár még nem tudjuk. A szerveroldali termék még meg sem jelent, és még hiányoznak a működő példák is. De jobb egy kicsit előregondolkodni, hogy ha majd ott állunk a probléma előtt, akkor tudjunk mit lépni.

Kővári Attila - BI projekt

hozzászólás

Kedves Attila, meg nem kérdőjelezve a szakmai érveket, amelyeket felsorakoztattál, a döntésnek szerintem nem kell megtörténnie - legalábbis olyan döntést, amely hosszú, hosszú évekre bebetonozza az ügyfelet, szerintem csak különleges esetekben lehet (szabad) technológiai jellegű érvekre alapozva meghozni. Ráadásul, az én nézetemben (na jó: az ügyfeleim nézetében) az üzleti intelligencia egy túlnyomórészt vizualizációs és (ebből fakadóan) modellezési és csak (jóval) kisebb súlyban szoftveres probléma. És bár minden modellnek előbb-utóbb valamilyen platformon meg kell valósulnia, a technológiai kérdéseket csak akkor fogják megérteni, ha valós döntéseket tudnak hozni: pl. a szebbik és kényelmesebbik eszköz _annyival_ lassabban hoz eredményt, hogy az már nem kényelmes, és akkor még mindig kérdés, hogy a teljesítmény tuningolható-e tovább. Ráadásul a PowerPivot (és hát más, oszlopalapú megközelítéssel operáló eszközök) megjelenésével és elterjedésével a piac is nyílik: mi tart vissza a nem MS adatbázisok MS-alapú vizualizációjától? Semmi. Csak éppen a szigorúan nem a felhasználóknak szánt staging területet az Excelen/Data Explorer-en keresztül a felhasználók arcába toljuk, még ha nem kérik, akkor is. Úgyhogy én azt hiszem, a pragmatizmus és a szépészet fog dönteni, a jogosultságok kiosztása és a kényelem, a frissítés önkiszolgáló megoldása és a sokféle bemeneti lehetőség ... és ezzel valószínűleg ékesen bizonyítottam, hogy nem értem a "technikalitások"-kal kapcsolatos dilemmádat.

... és ezzel valószínűleg ékesen bizonyítottam, hogy nem értem a "technikalitások"-kal kapcsolatos dilemmádat, viszont maximálisan osztom a meghozott döntések üzleti kockázataival kapcsolatos félelmeidet, és végső soron, mivel az üzleti oldal finanszírozza a projektjeinket, ezekre kell valamilyen megnyugtató választ (vagy inkább: válaszadási rendszert) találni.

Új hozzászólás