Cikkek BI & DWH tervezőknek és fejlesztőknek

Az alábbi oldalon összeszedtem minden olyan infót, BI és adattárház oktató anyagot, amely a BI/adattárház bevezetések műszaki/technológiai oldalával foglalkozik és elsősorban leendő adattárház tervezők, architektek, fejlesztők és dba-k fognak belőle profitálni.

Könyvek

Az utóbbi időben rám a legnagyobb hatással az alábbi könyvek voltak:

  • Dan Linstedt: Building a Scalable Data Warehouse with Data Vault 2.0 című könyve. Szívből ajánlom azoknak is, akik nem Data Vault módszertan alapján modellezik adattárházukat.
  • Ralph kimball: The Microsoft Data Warehouse Toolkit-jét szintén rongyosra olvastam anno. Aki csillagsémás adattárháztat épit Microsoft-os környezetben annak kötelező. 

 

Adattárház tervezéssel és fejlesztéssel foglalkozó cikkek

Személyek modellezése Power BI-ban

A múltkori ismétlődő szóközök megtartásával foglalkozó cikkben elkezdtük már pedzegetni, hogy milyen megoldások vannak Power BI-ban az azonos nevű személyek összevonásának elkerülésére. Ott az volt a megoldás, hogy az az azonos nevű személyek nevéhez hozzáfűztünk 1, 2, 3… n láthatatlan szóközt. Ezzel be tudtuk csapni a Power BI-t hiszen ő 1,2,3…n különböző személyt látott, de megjelenítésben nem látunk köztük különbséget. Működik ez a megoldás most is de ma már mást használunk helyette. Mit? Erről szól a most következő cikk…

Tovább

Összeérő idősort építsünk az adattárházban?

Az adattárházak historizáltak, azaz az adattárház minden egyes soráról meg tudjuk állapítani, hogy az mettől meddig volt érvényes. Tegyük fel hogy az érvényesség kezdetét a ValidFrom, a végét a ValidTo oszlopokban tároljuk. Kérdés: A korábbi rekord ValidTo-ja egyezzen a későbbi rekord ValidFrom-jával, vagy legyen közte egy miliszekundum rés? Másképpen fogalmazva összeérő idősort építsünk, vagy inkább össze nem érőt? A válasz kiderül a cikkből...

Tovább

Cross join Power Query-ben

Power Query-vel nagyon könnyű két táblát cross joinnal összeszorozni, csak a gyári megoldás sajnos nagyon lassú… Mondjuk annyira, hogy egy 6000 soros tábla összeszorzása egy 12 elemű oszloppal nem fut le pár percen belül. Mi a megoldás? Kiderül a cikkből...

Tovább

Tizedestört adattípusok Power BI-ban

Miért ne használjunk Decimal (Tizedes tört) adattípust Power BI-ban? Mi a különbség a Decimal Number (Tizedes tört) és a Fixed Decimal Number (Fixpontos tizedes tört) adattípusok között? Kiderül a cikkből.

Tovább

Excel (Power Pivot) fájlok időzített frissítése

A most következő cikkben megnézzük, hogy milyen lehetőségeink vannak a Power Pivotos Excel dashboardok időzített frissítésére. A témának az ad aktualitást, hogy a korábbi SharePointos megoldások nyugdíjazásra kerülnek, úgyhogy keresnünk kell helyette valamilyen más megoldást.

Tovább

Szerepjátszó dimenziók a Power BI-ban

Újra felmerült a haladó tanfolyamokon, hogy ,,milyen gagyi má, hogy nincsenek szerepjátszó dimenziók a Power BI-ban" Tényleg gagyi, de 1) ritkán van rá szükségünk 2) és van alternatív megoldásunk a problémára.

Tovább

Kódok vagy megnevezések?

Örök dilemma, hogy használjunk-e hosszú, mindenki által érthető, megnevezéseket az adatpiacokban, ad-hoc elemzésekre szánt adatkockákban, vagy használjuk inkább azok rövidebb, a szakterületek által használt megfelelőit...

Tovább

Új Cső

Örömmel jelentem, hogy elkészült a Cső második verziója. Nem kerültek ki előzetesen kémfotók a netre, nem szivárgott ki a bejelentés dátuma, a bejelentés során nem hangoztak „minden idők legjobb magyar nyelvű real-time BI könyve” jellegű kifejezések, nincs „one more thing”. Egész egyszerűen csak megjelent :-) Részletek a cikkben.

Tovább

A jövő önkiszolgáló BI világa

Az elemzés evolúciós lépcsőjének első fokán még csak riportokat kérnek a felhasználók az IT-tól. Később már nyersadatot kérnek aztán ha az is kevésnek bizonyul, akkor jön a hozzáférés kérése az adatok forrásához, rendszerek adatbázisához, adattárházakhoz. Itt tartunk most, de mi következik ezután? Ha megvan a hozzáférés az adatokhoz akkor mi lesz a felhasználók következő kérése az IT felé? Erről szól a cikk...

Tovább

Gyorsan változó szervezeti egységek BI stratégiája

A gyorsan növő/változó szervezeti egységek jellemzője, hogy mindent kinőnek, mindent folyamatosan változtatnak. Változnak a célok, napról napra változnak a prioritások és az igazságnak nem egy verziója van. Illetve pontosítok: Az igazságnak mindig van egy verziója, de ez időről időre változik :-) Hogyan érdemes egy ilyen gyorsan növő/változó szervezet információigényét kielégíteni? Erről szól a cikk...

Tovább

Miért Cső?

Holnaptól rendelhető a Cső, amely segítségégére lesz majd azoknak akik el akarnak indulni a Big Data világa felé, meg akarják ismerni azokat az architektúrákat, amelyek ki tudják szolgálni a real time Big Data igényeket, és meg akarják tudni azt is, hogy ezek megvalósításához milyen komponensek állnak ma rendelkezésre a Microsoft felhőjében (Azure). Mára már csak egy témánk maradt: Miért cső lett a neve...

Tovább

Szoftverfrissítési ciklusok rövidülése

Az SQL Server 2000 és 2005 megjelenése között 5 év telt el. Ennyi év kellett ahhoz, hogy a Microsoft új szoftververziót dobjon piacra. Ezt követően még 2005-ben bejelentették, hogy az új stratégiának megfelelően rövidíteni fogják a termékek megjelenése között eltelt időt, és az SQL Serverből 3 évente új verziót fognak piacra dobni. Ma a felhős BI és az önkiszolgáló BI világában már ott tartunk, hogy hetente jelennek meg újdonságok. Jó ez nekünk? Utánajárunk a cikkben

Tovább

Power BI Data Catalog - Lekérdezések megosztása

A most következő cikksorozatból megismerkedhet egy olyan adatmegosztási eszköztárral és módszertannal, amely segítségével a felhasználok az adatok helyett azok előállítási módját (magát a transzformációt) tudják megosztani egymással úgy, hogy mindez rejtve marad előttük: A transzformációt adatforrásként látják. Vajon véget vethet ez az eszköz az adatok küldözgetésének, másolgatásának illetve levélbe csatolásának korszaka? Kiderül a cikksorozatból…

Tovább

Power BI adatforrás konfigurálása

Folytatom a készülést a felhős/hibrid BI tanfolyamra. Kialakítottam egy olyan hibrid környezetet, ahol BI rendszer a felhőben van, a forrásadatok itt tengerszinten a helyi gépen. jöjjenek az adatforrás konfigurációs tapasztalatok.

Tovább

Oldalak