Alkalmas a Microsoft Exceles adatbázis-kezelője egy VIR felépítésére?

Sokszor kapom azt a kérdést - ha nem is mindig ilyen formában - hogy „ha az Excel mögött futó oszlopalapú adatbázis-kezelő (PowerPivot) add-in képes több 10 millió sort kezelni, akkor fel lehet vele építeni egy Vezetői Információs Rendszert?"

A Kérdés teljesen jogos. Van egy ingyenes döntéstámogatásra optimalizált adatbázis-kezelő amely több 10 millió sort tud kezelni, és a válaszidői sokkal gyorsabbak, mint a fizetős Analysis Services válaszidői, akkor miért ne használjuk Vezetői Információs rendszerek építésére? Pláne, ha egy Excel-en és egy Excel bővítményen kívül más nem is kell hozzá? Sőt elfut egy levetett asztali PC-n is. És ha még azt is figyelembe vesszük, hogy sok hazai vállalatnak vagy szakterületnek nincs is évi néhány 10 milliónál több üzleti tranzakciója, akkor a kérdés kezd egyre érdekesebbé válni.

Nos. Tavaly kb. ilyenkor ugyanezeken a kérdéseken gondolkodtam csak a tanácsadó szemüvegén keresztül: Hogyan, mire használhatjuk majd ezt az új oszlopalapú adatbázis-kezelőt; hol vannak a korlátai; meddig tudok elmenni vele az SQL, SharePoint Portal szerver nélkül; melyek azok a buktatók, amelyekről nem mesélnek a dokumentációk, alkalmas-e szakterületi BI rendszer építésre, stb.

Elővettem hát egy 1999-es projekt input fájljait és megpróbáltam belőlük felépíteni a vezetői információs rendszert. Pont úgy, mint 11 évvel ezelőtt: Az informatika felteszi a Kontrolling\VIR könyvtárba az új adatokat, nekünk pedig fel kell építenünk belőle a vezetői információs rendszert és gondoskodnunk kell arról is, hogy a VIR frissítése hetente megtörténjen. A feladat tehát ugyanaz mint 11 éve, de a megvalósításhoz már nem áll rendelkezésünkre adatbetöltő eszköz, sem relációs adatbázis kezelő, sem egyéb feldolgozást segítő program, csak az Excel és annak PowerPivot bővítménye.

Tapasztalatok, eredmények

Az inputként kapott szövegfájlok tele vannak hibákkal, mint minden valós projekt esetében. Az ékezetes betűk helyett hieroglifákat kapunk (a 90-es években ez gyakran előfordult); A cikktörzs állomány leválogatása hibás, ugyanis találok jó néhány olyan cikket, amelyre volt forgalom az adott időszakban, de a cikktörzsben nem jelennek meg; stb.

Betöltöm az adatokat a PowerPivot oszlopalapú adatbázisába. Meghatározom a kapcsolatokat a táblák között. Minden simán megy. A hiányzó cikkeket tartalmazó forgalomhoz hozzárendel egy üres (megnevezés nélküli) cikket. Gyakorlatilag órák alatt összeállítottam a vezetői információs rendszer értékesítési kontrolling moduljának első adatkockáját. Nagyjából ugyanazt, mint 11 éve. Mutatószámokat képzek, aggregálok, stb. Mindezt minden szervertől távol az otthon zenehallgatásra használt csendes PC-n. Lenyűgöz az eszköz egyszerűsége és a lekérdezési teljesítménye.

Ám amikor rá akarom tölteni a feltöltött vezetői információs rendszerre a következő heti adatokat, akkor belefutok az első korlátba: Nem tudom hozzáfűzni a PowerPivot adatbázisban tárolt adatokhoz az új adatokat. Ezt az SQL-SharePoint nélküli „ingyenes" verzióval nem tudom megoldani. Persze ha az IT minden héten leválogatná a teljes adatállományt, vagy rálátnék egy mindig frissülő adatbázisra, akkor a probléma meg lenne oldva. Illetve csak az egyik fele. A másik felébe akkor ütköznénk, ha automatikusan (időzítve) szeretnénk frissíteni az Excel mögött található adatbázist. Ehhez ugyanis már szükség van az SQL Server - SharePoint párosra. De ha elég a kézi frissítés, akkor ez a probléma sem jelent akadályt.

Konklúzió

A PowerPivot-ot nem arra találták ki, hogy segítségével vezetői információs rendszereket építsünk. Nem erre tervezték. De ha nincs szükség az inkrementális feltöltésre (mert minden nap újra tudjuk tölteni a teljes VIR-t) és elég a kézi frissítés, akkor pusztán az Excel 2010 mögé bújtatott inygenes PowerPivot bővítménnyel is tudunk építeni több 10 millió sort tartalmazó vezetői információs rendszert. Még ha nem is ez a Best practice :-)

Kővári Attila - BI projekt

hozzászólás

Az automatikus frissítést nem lehet valahogy parancssorből, külső ütemező segítségével megoldani?

A biztonság gondolom továbbra is kérdés. Aki hozzáfér a fájlhoz az meg is tudja nyitni (és le is tudja másolni..)

A PowerPivot támogatja a többszintű hierarchiákat a dimenziókban? Mert azért az is komoly különbség a sima pivot table és az AS között.

Szabin voltam, úgyhogy bocs a késői válaszért :-) @Bence Valószínű meg lehet oldani az automatikus frissítést, de nem jártam utána még a témának @Ambrus Így van. Aki hozzáfér a fájlhoz, az le is tudja másolni. Lehet, hogy le lehetne védeni valahogy, de a védelem erőssége a felhasználó kezében van. A SharePointos változatban ez meg van oldva, hiszen ott a PowerPivot adatbázis befordul az Analysis Services alá és így a lekérdezéseket már az Analysis Services szolgálja ki. De a SharePoint nélküli változatban nincs. @Sander A PowerPivot nem ismeri a hierarchiák fogalmát. Oszlopokban (a mi fogalmaink szerint attribútumokban) gondolkodik. Látszólagos hierarchiát létre tudnak hozni a felhasználók az attribútumok egymásba ágyazásával (év alá behúzzák a negyedévet alá a hónapot) de ez nem igazi hierarchia. Érdemes egyébként megnézni, hogy hogyan forgatja be az Analysis Services az oszlopalapú adatbázist a többdimenziós struktúra alá. (miből lesznek a dimenziók, miből a measure-ök, …) Viszonylag egyszerűen kipróbálható és sokat lehet belőle tanulni. Nem kell mást tenni, mint kiszedni az excel fájlból az item1.Data fájlt (ami valójában egy SSAS backup fájl) és ezt visszatölteni (restore) egy IMBI módban futó Analysis Services-re. (itt le is írják, hogy hogyan lehet megcsinálni: http://powerpivotfaq.com/Lists/TGPPF/DispForm.aspx?ID=56)

@Bence Most olvasom, hogy egy külső cég már elkezdte fejleszteni azt a megoldást, amely segítségével automatikusan frissíthetjük az Excel fájl mögött lévő adatbázist. Sőt, azt ígérik, hogy a lapozó területeken lévő szűrőket is léptetni fogják tudni pl. az aktuális hónapra. Link: http://powerpivotpro.com/2011/02/02/powerpivot-accelerators-the-story-and-announcing-the-private-beta/

Új hozzászólás