Cikkek BI & DWH tervezőknek és fejlesztőknek

Az alábbi oldalon összeszedtem minden olyan infót, BI és adattárház oktató anyagot, amely a BI/adattárház bevezetések műszaki/technológiai oldalával foglalkozik és elsősorban leendő adattárház tervezők, architektek, fejlesztők és dba-k fognak belőle profitálni.

Könyvek

Az utóbbi időben rám a legnagyobb hatással az alábbi könyvek voltak:

  • Dan Linstedt: Building a Scalable Data Warehouse with Data Vault 2.0 című könyve. Szívből ajánlom azoknak is, akik nem Data Vault módszertan alapján modellezik adattárházukat.
  • Ralph kimball: The Microsoft Data Warehouse Toolkit-jét szintén rongyosra olvastam anno. Aki csillagsémás adattárháztat épit Microsoft-os környezetben annak kötelező. 

 

Adattárház tervezéssel és fejlesztéssel foglalkozó cikkek

Hogyan motiváljuk a tesztelőket?

A felhasználók rendszerint nem azonos intenzitással tesztelnek a tesztidőszak alatt. Vannak akik magukénak érzik a dolgot és becsülettel tesztelnek, vannak akik az első megtalált hiba után ledobják a Riga láncot és addig nem folytatják a tesztet, amíg a hiba kijavításra nem kerül; vannak akik másra várnak és még sorolhatnám. A kérdés csak az: Hogyan motiváljuk a tesztelőket?

Tovább

Csillag vagy hópehely séma?

Nagy általánosságban – és a legjobb gyakorlatoknak megfelelően – kerüljük a hópehelyséma használatát. Vannak azonban olyan esetek, amikor érdemes elgondolkodni a használatán. A cikkben ezen ritka esetekre kerestem egy-két példát

Tovább

SQL Server elérése a loginok törlése után...

Hatalmas hibát követtem el a minap. Kitöröltem egy SQL cluster összes loginját. Rosszul állítottam össze egy drop-create scriprtet, ami kitörölte az összes logint. Közte a sajátomat is. Brrrr. Ott álltunk egy SQL Serverrel amihez gyakorlatilag sen...

Tovább

Miért gyorsak az OLAP adatbázis-kezelők?

Az OLAP adatbázis-kezelők gyorsaságának egyik oka az, hogy előre felaggregálják azokat az adatokat, amelyekről úgy gondolják, hogy szükségük lesz rájuk a felhasználóknak. A kérdés csak az, hogy honnan tudják, hogy mire lesz szükségük a felhasználóknak? A cikkben ezt a témát járjuk körbe, illetve a végén megosztunk egy szolgálati közleményt is.

Tovább

Melyik a gyorsabb: Union vagy OR?

Lejegyzetelem ide, hogy néha jobb eredményt ad ha a WHERE feltételben megadott szűréseket szétbontjuk, és két vagy több lekérdezés uniójával állítjuk elő. Mutatom. --Query 1 : OR SELECT * FROM Sales.SalesOrderDetailWHERE ProductID = 714 OR Product...

Tovább

NON EMPTY; NONEMPTYCROSSJOIN problémák

Lejegyzetelem ide, hogy a NONEMPTYCROSSJOIN (DimA.members, DimB.members, DimC.members)típusú lekérdezés emberi időben le se fut, de ha átírjuk ilyenre:NONEMPTY (DimA.members * DimB.members * DimC.members)Akkor pár másodperc alatt lefut.Chris Webb-...

Tovább

Hogyan kezeljük az időzónákat az adattárházban?

Adott egy multinacionális vállalat, amely eltérő időzónájú országokban is értékesít. A kérdés az, hogy milyen időponton szerepeltessük az eseményeket az adattárházban? Lokális, vagy valamilyen egyezményes időponton mint például az UTC? Ennek járunk most utána.

Tovább

SQL Server startup paraméterek adattárházas környezetben

BUÉK! Idén olyan helyen voltunk szilveszterezni, ahol nem volt térség, így nem tudtam publikálni a nagy gonddal megírt 2010-es évről szóló cikket. Ma, 2011-ben pedig már elszállt az ereje, úgyhogy BUÉK és csapjunk a lecsóba. A téma az SQL Server startup paraméterei adattárházas környezetben

Tovább

Barangolások a 4 Tera feletti adattárházak világában

Nemrég lehetőségem nyílt közelebbről is szemügyre venni egy Fast Track Data Warehouse referencia architektúra alapján összeállított adattárházat, és ennek tapasztalatairól szeretnék most beszámolni. Elsősorban arra keresem a választ, hogy mit tudunk átvenni a nagyoktól és mit tudunk a referencia architektúra ajánlásaiból használni akár kisebb méretekben is.

Tovább

A Microsoft referencia adattárház architektúrája

Nemrég jelent meg a Microsoft adattárház appliance-e, a Parallel Data Warehouse Edition és ennek kapcsán egy kicsit szemügyre vesszük a kistesót, a magyarországi méretekhez jobban passzoló 4-48 terára optimalizált Fast Track Data Warehouse referencia adattárház architektúrát.

Tovább

Tegyünk természetes kulcsot a ténytáblákba?

A tankönyvek szerint ne. Elmondom, hogy ennek ellenére mégis miért igen:1. Százszor egyszerűbb megoldani a mesterséges kulcsok kikeresését (lookup) a dimenziótáblából, ha a ténytáblában ott van a természetes kulcs2. Százszor egyszerűbb tesztelni, ...

Tovább

Hány kockát építhetünk egy adatbázisban?

Összesen 2^31-1 azaz kicsit több, mint kétmilliárd kockát építhetünk egy Analysis Services-en alapuló BI megoldásba. Jó tudni, nehogy a kockák gyártása közben véletlenül túlszaladjunk ezen a korláton. JAz Analysis Services felső korlátairól a Maxi...

Tovább

Egy nagy kocka vagy sok kicsi - A fejlesztői élmény

A múlt heti cikkben a „sok kis adatkocka vagy egy nagy” dilemmát az üzleti felhasználók oldaláról közelítettük meg. Azt vizsgáltuk, hogy a felhasználói élmény szempontjából melyik a jobb megoldás. Most átülünk a fejlesztők székébe és a technológia lehetőségei felöl közelítjük meg a problémát...

Tovább

Egy nagy kocka vagy sok kicsi - Tervezés

Most, hogy újra elolvastam az „Egy nagy adatkocka vagy sok kicsi - felhasználói élmény” című cikket, eszembe jutott még valami. Írom, hogy az üzleti felhasználók szempontjai miatt érdemes egy nagy kockában gondolkodni, de nem írtam arról, hogy hog...

Tovább

Egy nagy kocka vagy sok kicsi - A felhasználói élmény

Adatpiacok, vezetői információs rendszerek tervezése során gyakran felmerül a kérdés, hogy egy nagy adatkockát építsünk, vagy szakterületenként/üzleti folyamatonként egy-egy kicsit. A most következő cikkben ennek járunk utána, és első körben a felhasználók szempontjából vizsgáljuk meg a problémát

Tovább

Szülő/gyerek hierarchiák historizálása

A könnyedebb témákról átmegyünk egy kicsit az adattárház adatmodell tervezési kérdéseire, és megvizsgáljuk, hogy milyen lehetőségeink vannak a szervezet/dolgozók/üzletkötők, ... típusú hierarchiák modellezésére.

Tovább

Adattárház könyvek: Általános adattárház elmélet

Még februárban kezdtem el írni egy cikket annak apropóján, hogy Kimball-nak új adattárház könyve jelent meg, de végül nem publikáltam. Nem publikáltam, mert 1) akartam még érlelni egy kicsit az első benyomásaimat 2) írni akartam még azokról az adattárház könyvekről is, amelyekről azt gondolom, hogy segítséget fognak nyújtani másoknak is. Ezek következnek most.

Tovább

Tegyünk idegen kulcsot a csillagsémára?

Megmondom őszintén én nem szoktam soha. Régen úgy tanultam, hogy feleslegesen terheli a procit, hogy az integritás biztosiasa az ETL folyamatok feladata, stb. De most olvastam egy internetes közvélemény kutatást (Nem reprezentatív!), amiből az der...

Tovább

Az Excel nem kezeli a szakadozott hierarchiákat. Vagy mégis?

Az Excel 2007 néha jól jeleníti meg a szakadozott hierarchiákat, néha nem. Első ránézésre nem is érti az ember, hogy amit egyszer jól csinál másszor miért nem. Aztán ha kicsit utánajár a témának, akkor még jobban elkeseredik. A leírt működés ugyanis nem egy hiba következménye, hanem az Excel alapból nem támogatja a szakadozott hierarchiák megjelenítését. Miért működik akkor néha mégis jól? Ennek járunk most utána.

Tovább

Oldalak