Cikkek BI & DWH tervezőknek és fejlesztőknek

Az alábbi oldalon összeszedtem minden olyan infót, BI és adattárház oktató anyagot, amely a BI/adattárház bevezetések műszaki/technológiai oldalával foglalkozik és elsősorban leendő adattárház tervezők, architektek, fejlesztők és dba-k fognak belőle profitálni.

Könyvek

Az utóbbi időben rám a legnagyobb hatással az alábbi könyvek voltak:

  • Dan Linstedt: Building a Scalable Data Warehouse with Data Vault 2.0 című könyve. Szívből ajánlom azoknak is, akik nem Data Vault módszertan alapján modellezik adattárházukat.
  • Ralph kimball: The Microsoft Data Warehouse Toolkit-jét szintén rongyosra olvastam anno. Aki csillagsémás adattárháztat épit Microsoft-os környezetben annak kötelező. 

 

Adattárház tervezéssel és fejlesztéssel foglalkozó cikkek

Cross join Power Query-ben

Power Query-vel nagyon könnyű két táblát cross joinnal összeszorozni, csak a gyári megoldás sajnos nagyon lassú… Mondjuk annyira, hogy egy 6000 soros tábla összeszorzása egy 12 elemű oszloppal nem fut le pár percen belül. Mi a megoldás? Kiderül a cikkből...

Tovább

Tizedestört adattípusok Power BI-ban

Miért ne használjunk Decimal (Tizedes tört) adattípust Power BI-ban? Mi a különbség a Decimal Number (Tizedes tört) és a Fixed Decimal Number (Fixpontos tizedes tört) adattípusok között? Kiderül a cikkből.

Tovább

Excel (Power Pivot) fájlok időzített frissítése

A most következő cikkben megnézzük, hogy milyen lehetőségeink vannak a Power Pivotos Excel dashboardok időzített frissítésére. A témának az ad aktualitást, hogy a korábbi SharePointos megoldások nyugdíjazásra kerülnek, úgyhogy keresnünk kell helyette valamilyen más megoldást.

Tovább

Szerepjátszó dimenziók a Power BI-ban

Újra felmerült a haladó tanfolyamokon, hogy ,,milyen gagyi má, hogy nincsenek szerepjátszó dimenziók a Power BI-ban" Tényleg gagyi, de 1) ritkán van rá szükségünk 2) és van alternatív megoldásunk a problémára.

Tovább

Kódok vagy megnevezések?

Örök dilemma, hogy használjunk-e hosszú, mindenki által érthető, megnevezéseket az adatpiacokban, ad-hoc elemzésekre szánt adatkockákban, vagy használjuk inkább azok rövidebb, a szakterületek által használt megfelelőit...

Tovább

Új Cső

Örömmel jelentem, hogy elkészült a Cső második verziója. Nem kerültek ki előzetesen kémfotók a netre, nem szivárgott ki a bejelentés dátuma, a bejelentés során nem hangoztak „minden idők legjobb magyar nyelvű real-time BI könyve” jellegű kifejezések, nincs „one more thing”. Egész egyszerűen csak megjelent :-) Részletek a cikkben.

Tovább

A jövő önkiszolgáló BI világa

Az elemzés evolúciós lépcsőjének első fokán még csak riportokat kérnek a felhasználók az IT-tól. Később már nyersadatot kérnek aztán ha az is kevésnek bizonyul, akkor jön a hozzáférés kérése az adatok forrásához, rendszerek adatbázisához, adattárházakhoz. Itt tartunk most, de mi következik ezután? Ha megvan a hozzáférés az adatokhoz akkor mi lesz a felhasználók következő kérése az IT felé? Erről szól a cikk...

Tovább

Gyorsan változó szervezeti egységek BI stratégiája

A gyorsan növő/változó szervezeti egységek jellemzője, hogy mindent kinőnek, mindent folyamatosan változtatnak. Változnak a célok, napról napra változnak a prioritások és az igazságnak nem egy verziója van. Illetve pontosítok: Az igazságnak mindig van egy verziója, de ez időről időre változik :-) Hogyan érdemes egy ilyen gyorsan növő/változó szervezet információigényét kielégíteni? Erről szól a cikk...

Tovább

Miért Cső?

Holnaptól rendelhető a Cső, amely segítségégére lesz majd azoknak akik el akarnak indulni a Big Data világa felé, meg akarják ismerni azokat az architektúrákat, amelyek ki tudják szolgálni a real time Big Data igényeket, és meg akarják tudni azt is, hogy ezek megvalósításához milyen komponensek állnak ma rendelkezésre a Microsoft felhőjében (Azure). Mára már csak egy témánk maradt: Miért cső lett a neve...

Tovább

Szoftverfrissítési ciklusok rövidülése

Az SQL Server 2000 és 2005 megjelenése között 5 év telt el. Ennyi év kellett ahhoz, hogy a Microsoft új szoftververziót dobjon piacra. Ezt követően még 2005-ben bejelentették, hogy az új stratégiának megfelelően rövidíteni fogják a termékek megjelenése között eltelt időt, és az SQL Serverből 3 évente új verziót fognak piacra dobni. Ma a felhős BI és az önkiszolgáló BI világában már ott tartunk, hogy hetente jelennek meg újdonságok. Jó ez nekünk? Utánajárunk a cikkben

Tovább

Power BI Data Catalog - Lekérdezések megosztása

A most következő cikksorozatból megismerkedhet egy olyan adatmegosztási eszköztárral és módszertannal, amely segítségével a felhasználok az adatok helyett azok előállítási módját (magát a transzformációt) tudják megosztani egymással úgy, hogy mindez rejtve marad előttük: A transzformációt adatforrásként látják. Vajon véget vethet ez az eszköz az adatok küldözgetésének, másolgatásának illetve levélbe csatolásának korszaka? Kiderül a cikksorozatból…

Tovább

Power BI adatforrás konfigurálása

Folytatom a készülést a felhős/hibrid BI tanfolyamra. Kialakítottam egy olyan hibrid környezetet, ahol BI rendszer a felhőben van, a forrásadatok itt tengerszinten a helyi gépen. jöjjenek az adatforrás konfigurációs tapasztalatok.

Tovább

7 ország 7 adatkocka?

Adott egy adattárház amely 7 különböző ország adatait tartalmazza. Kérdés: Készítsünk külön-külön adatkockákat az egyes országoknak vagy mindenki használja a „nagy” adatkockát?

Tovább

Oldalak