Újdonságok 2010-re: Kilimandzsáró, Madison, és Gemini

Kővári Attila 2008. október 14.

Előző héten két fontos újdonságot is bejelentett a Microsoft a most már szokásosnak nevezhető éves Microsoft üzleti intelligencia konferencián, Seattle-ben. Az egyik a „Madison projekt", a másik a „Gemini projekt" volt

Project Madison

Elöljáróban:

"Project Madison is Share-nothing MPP scale-out version of SQL Server, powered by DATAllegro technology"

Lefordítva a Project Madison a DATAlllegro technológiáját használó, „semmit sem megosztó" masszívan párhuzamosított architektúrára épülő oldalra skálázott verziója az SQL Servernek. Mindjárt elmagyarázom, hogy mit is jelent ez pontosan.

A történet ott kezdődik, hogy a Microsoft elhatározta, hogy olyan technológiát vásárol, amely segítségével óriási adattárházakat fog tudni építeni kommersz szerverek felhasználásával, Windows-zal, és SQL szerverrel. Idén áprilisban tárgyalásokba kezdett a DATAllegro-val és július végén hivatalosan is bejelentették, hogy felvásárolták őket. Néhány hónap csend következett, majd előző hétfőn a üzleti intelligencia konferencia keynote előadásában bemutatták az új szerzeményt. (Ha kíváncsi rá, nézze meg a keynote előadást, és csévéljen az 1:03 perchez. (csak 10 perc, érdemes megnézni))

Az előadáson egy olyan 150 terabájtos „adattárházat" mutattak be, amely összesen 24 kommersz Dell szerveren futott. (A dimenziótáblákat minden egyes gépre replikálták, de az 1 trillió soros ténytáblát szétdarabolták a 24 gépre). Ezt a 24 Dell szervert fogta össze a DATAllegro technológiája, ami másodperces válaszidőkkel szolgálta ki a Reporting Services-ből indított lekérdezéseket.

A technológia előnye, hogy a felhasználó is, és az üzemeltető is csak SQL Servert (szervereket) lát, a technológia rejtve marad. (Az üzemeltetők SQL szervereket üzemeltetnek, az adattárház pedig ugyanúgy kérdezhető le, mint egy mezei egygépes adattárház)

Azt, hogy a Microsoft elő fog állni valami hasonlóval, a DATAllegro felvásárlása után már sejteni lehetett. Így - bár a demó nagyon hatásos volt - akkora újdonságot mégsem jelentett.

De a keynote előadás tartogatott még egy meglepetést: A „Project Gemini"-t

Project Gemini

Aki nem látta a bejelentést, annak megpróbálom leírni, hogy mit is mutattak be. (De itt meg is nézheti, csak csévéljen a 1:21 perchez)

Adott egy on-line bolt, amely mozifilmeket árul. Mi vagyunk ennek az on-line boltnak az elemzői és össze akarjuk hasonlítani a filmforgalmazási adatainkat más forgalmazók adataival. Betöltjük az Excelbe a forrásrendszerből az adatokat (több mint 20 millió sort) egy úgynevezett Gemini Excel bővítményen keresztül, majd letöltjük a Billboard (top)listát az internetről és a két adathalmazt megnyitjuk a pivot táblával. És láss csodát. Megjelenik a két adathalmaz összepároztatva: Közös dimenziói mentén elemezhetjük saját és idegen forrásból szerzett adatainkat. Mint egy hetekig fejlesztett OLAP kockából. A tömeg tapsol. Éljen az önkiszolgáló üzleti intelligencia! Függöny le.

Kicsit sajnálom, hogy azt sulykolják az emberek fejébe, hogy az új SQL Serverrel (amit a Kilimandzsáró fedőnévvel láttak el) erre bárki képes lesz, és kvázi felesleges adattárházakat építenünk, hiszen ott az Excel ami akár 20 millió sorral is megbirkózik, mindezt egy mezei PC-n. De erről majd valamikor máskor, mert ez is megér egy misét.

Nézzük a technológiai oldalát, mert az viszont érdekes, hiszen mindez tényleg egy 1000 dolláros pc-n futott (igaz 8 giga rammal)

„Project Gemini is Analysis Services using column-oriented and in-memory technologies running inside Excel and in SharePoint"

A háttérben tehát egy Excelbe integrált Analysis Services áll. Újdonság ez? Nem, hiszen az Analysis Services a kezdetektől fogva kettős életet élt: futott szerver alkalmazásként és kliensoldali alkalmazásként is. Segítségével tudtunk például kliens oldalon lokális kockákat, úgynevezett cube fájlokat generálni, amit aztán átvihettünk másik kliensre és ott is meg tudtuk nyitni.

Ami új, az az úgy nevezett „column-oriented and in-memory technologies", ami nem más, mint egy új tárolási módja az Analysis Services-nek. Eddig ugye volt a ROLAP-MOLAP-HOLAP hármas (illetve ezek árnyalt változatai, mint a low latency MOLAP, ...) és most be fog jönni negyedikként ez az oszlop orientált, memória alapú tárolási mód. És mivel ez egy tárolási mód, ezért minden eddigi és ezután keletkező kliens alkalmazás is le fogja tudni kérdezni az így tárolt adatokat.

S hogy gyors lesz-e mint az oszlop orientált Sybase IQ, vagy kiválóan lehet majd tervezni és modellezni vele, mint a memória alapú (IBM/Cognos/Applix) TM1-gyel? Ezt majd meglátjuk.

felhasznált irodalom

Kővári Attila - BI projekt

Már készül a következő cikk. Kérjen értesítést a megjelenéséről itt.

Újdonságok 2010-re: Kilimandzsáró, Madison, és Gemini

Project Madison

Project Gemini

Új hozzászólás