A jövő önkiszolgáló BI világa


Amikor írtam a Cső-t azon gondolkodtam, hogy vajon a stream processing technológiák és a felhő széles körben történő elterjedése milyen hatással lesz a BI és adattárház világra? Vajon a stream-ek csak egy részét képezik majd az adattárház architektúrának, vagy mindent stream-ként fogunk kezelni és real-time adattárházakat fogunk építeni?

Képzeljen el egy olyan világot, ahol a felhasználók nem adatot kapnak, hanem hozzáférést egy olyan csőhöz, amin keresztül az adatok folyamatosan áramlanak. Belenézhetnek ebbe a csőbe, kivehetik belőle azokat az adatokat, amik nekik kellenek és letárolhatják olyan formában, amilyen formában az elemzéseikhez szükséges. Mint ahogy az áramot használjuk: Rácsatlakozunk a központi vezetékre, kiveszünk belőle annyi áramot, amennyi kell és azt arra használjuk amire akarjuk.

  • Lesz aki csak real-time elemzéskere használja a csövön átfolyó adatokat, majd miután végzett az elemzéssel kiönti őket.
  • Lesz aki idősort épít majd belőlük és eltárolja azokat.
  • És lesz aki csak figyeli a csövet és ha olyan infó jön ami értékes, akkor gyorsan kiveszi magának. A csövet figyelve ugyanis sokkal könnyebben és sokkal gyorsabban kinyerhető a kincset érő információ mint amikor már benne van egy hatalmas adattengerben és ott kéne megtalálni, onnan kéne kipecázni.

Ebben a világban az IT szerepe annyi lenne, hogy biztosítsa az adatok áramlásához szükséges csövet, hozzáférést biztosítson a csőhöz, a cső végén kifolyó adatokat tárolja, és a felhasználók számára hozzáférhetővé tegye.

Utópisztikus? Egy ponton igen. Ma még az is utópisztikus, hogy a felhasználóknak csak adatokat adunk, amit ők önkiszolgáló módon használnak fel. Ehhez képest valóságos evolúciós ugrás az, amikor már adatot sem kapnak, csak hozzáférést egy csőhöz, amin keresztül nagy sebességgel áramlanak a vállalat adatai, és amiből saját vezetékeiken keresztül elszállíthatják magukhoz az adatokat és gondoskodhatnak azok tárolásáról, elemzéséről.

Összefoglalva: A kezdet kezdetén még csak riportokat kértek a felhasználók az IT-tól. Később már nyers adatot kértek aztán ha az is kevésnek bizonyult, akkor jön a hozzáférés kérése az adatok forrásához, rendszerek adatbázisához, adattárházakhoz. Itt tartunk most, de el fog jönni az idő amikor már ez is kevés lesz és az elemzők egy csoportjának a rendszerek közti adatáramlást biztosító csőhöz kell majd hozzáférést adnunk...

POWER BI WORKSHOP

Tudjon meg többet az itt elhangzottakról! Jöjjön el a 2017. november 30.-i Power BI workshopra. Részletek >>

  

Elválasztó

Már készül a következő cikk. Kérjen értesítést a megjelenéséről itt.

|

3 Hozzászólás

Szia Attila! Azért ez egy

Szia Attila!

Azért ez egy kicsit ellentmondásos:
- egyrészt csak a csőhöz kell hozzáférjenek a felhasználók, kivehetik, ami nekik kell és letárolhatják, amilyen formában szükséges
- másrészt az "IT szerepe, hogy ... a cső végén kifolyó adatokat tárolja, és a felhasználók számára hozzáférhetővé tegye"

Az áram nem jó példa, mert ott mindegy, hogy mikor "veszed ki", mindig ugyanolyan.

A vízcső végén a "pocsolya" ;-) sincs teljesen rendben. Bár jól mutatja, hogy mi lesz "governance" nélkül,

Üdv,
Gábor

Jogos, nem fejtettem ki az egészet...

Jogos, nem fejtettem ki az egészet. Kösz az észrevételt

Tegyük fel a felhasználót csak azok a mérések érdeklik, amelyek meghaladták a határértéket. Ezeket kiveszi a csőből és letárolja magának, majd olyan riportokat készít belőle, mint a naponként határérték túllépések számának alakulása.

Ezzel szemben az IT letárolja az összes mérést. Függetlenül attól, hogy volt-e határérték túllépés vagy sem.
Áramból van váltóáram, egyenáram, kóboráram :-) Úgyhogy sok fajtája van, nem mindig ugyanolyan :-) De tényleg nem jó példa. Igazából azt akartam vele szimbolizálni, hogy arra tudod használni amire akarod. Árammal tudsz világítani, fűteni, motort forgatni, stb. Adattal pedig tudsz csalás detektálni, tendenciákat elemezni, riasztásokat generálni. Mindkettő közmű, mindkettő esetén ugyanabból a forrásból más és más outputot tudunk előállítani attól függően, hogy mire van igény.

A pocsolya nem pocsolya, hanem tó. Egy igazi Data Lake, ahol az adatok metaadatokkal fel vannak címkézve, mennyiségéről, minőségéről és egyéb tulajdonságukról katalógust vezet az IT az üzleti felhasználók pedig üzleti jelentéssel ruházzák fel az adatokat. Úgyhogy nem pocsolya :-)

Köszi a

Köszi a magyarázatot.

mottó: "Tiszta vizet a pohárba!" ;-)

Szóljon hozzá!

Szabály: Legyen kedves, segítõkész és vállalja a nevét.
A mező tartalma nem nyilvános.
  • A web és email címek automatikusan linkekké alakulnak.
  • Engedélyezett HTML elemek: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • A sorokat és bekezdéseket automatikusan felismeri a rendszer.
ANTI SPAM
A robot regisztrációk elkerülésére.
Image CAPTCHA
Figyeljen a kis és nagybetűk használatára

POWER BI WORKSHOP

Tudjon meg többet az itt elhangzottakról! Jöjjön el a 2017. november 30.-i Power BI workshopra. Részletek >>