Cikkek BI & DWH tervezőknek és fejlesztőknek

Az alábbi oldalon összeszedtem minden olyan infót, BI és adattárház oktató anyagot, amely a BI/adattárház bevezetések műszaki/technológiai oldalával foglalkozik és elsősorban leendő adattárház tervezők, architektek, fejlesztők és dba-k fognak belőle profitálni.

Könyvek

Az utóbbi időben rám a legnagyobb hatással az alábbi könyvek voltak:

  • Dan Linstedt: Building a Scalable Data Warehouse with Data Vault 2.0 című könyve. Szívből ajánlom azoknak is, akik nem Data Vault módszertan alapján modellezik adattárházukat.
  • Ralph Kimball: The Microsoft Data Warehouse Toolkit-jét szintén rongyosra olvastam anno. Aki csillagsémás adattárháztat épit Microsoft-os környezetben annak kötelező. 

 

Adattárház tervezéssel és fejlesztéssel foglalkozó cikkek

Építsünk hierarchiákat?

Most, hogy vége van a nyárnak ideje felpörögni. Az első bejegyzés a hierarchiák fontosságával illetve az alternatív hierarchiák megvalósítási lehetőségeivel fog foglalkozni.

Tovább

SQL 2012 újdonságok a BI jegyzeteken

Úgy tervezem, hogy a hazai SQL Server 2012 bejelentésig minden nap bemutatok egy-egy SQL 2012 újdonságot a BI jegyzetek oldalon. Csak néhány szóban megemlítve, esetleg képekkel illusztrálva, linkekkel, kifejezetten technikai embereknek. Ha érdekli a téma, akkor olvassa el a részleteket.

Tovább

Tegyünk logót a riportra?

Az egyik oldalról úgy gondolom, hogy ne, hiszen kerülni kell minden olyan grafikai elemet, ami elvonja az információ befogadójának figyelmét a riport mondanivalójáról, a másik oldalról viszont azt látom, hogy egy logó lehet bizalomépítő is. Jöjjenek az érvek…

Tovább

Magyar nyelvi kérdések az SQL 2012 kapcsán

Felraktam az SQL Server 2012 RC0-át és a collation default beállítása Hungarian_CI_AS. Mutatom:Miért baj ez? Mert a Hungarian collation használja a dupla mássalhangzókat. Csakhogy szegén SQL Server nem tudja eldönteni, hogy pl. a „Táncstúdió” szav...

Tovább

HR szakértő tanácsa BI szakembereknek

Az utóbbi időszakban egyre több HR szakértő szeretett volna kapcsolódni a LinkedIn-es közösségi hálómhoz. Sejtettem hogy miért, de mivel pontosan nem tudtam, ezért egyiküket megkérdeztem. Válaszolt, és a válasza nagyon meglepett…

Tovább

Hogyan motiváljuk a tesztelőket?

A felhasználók rendszerint nem azonos intenzitással tesztelnek a tesztidőszak alatt. Vannak akik magukénak érzik a dolgot és becsülettel tesztelnek, vannak akik az első megtalált hiba után ledobják a Riga láncot és addig nem folytatják a tesztet, amíg a hiba kijavításra nem kerül; vannak akik másra várnak és még sorolhatnám. A kérdés csak az: Hogyan motiváljuk a tesztelőket?

Tovább

Csillag vagy hópehely séma?

Nagy általánosságban – és a legjobb gyakorlatoknak megfelelően – kerüljük a hópehelyséma használatát. Vannak azonban olyan esetek, amikor érdemes elgondolkodni a használatán. A cikkben ezen ritka esetekre kerestem egy-két példát

Tovább

SQL Server elérése a loginok törlése után...

Hatalmas hibát követtem el a minap. Kitöröltem egy SQL cluster összes loginját. Rosszul állítottam össze egy drop-create scriprtet, ami kitörölte az összes logint. Közte a sajátomat is. Brrrr. Ott álltunk egy SQL Serverrel amihez gyakorlatilag sen...

Tovább

Miért gyorsak az OLAP adatbázis-kezelők?

Az OLAP adatbázis-kezelők gyorsaságának egyik oka az, hogy előre felaggregálják azokat az adatokat, amelyekről úgy gondolják, hogy szükségük lesz rájuk a felhasználóknak. A kérdés csak az, hogy honnan tudják, hogy mire lesz szükségük a felhasználóknak? A cikkben ezt a témát járjuk körbe, illetve a végén megosztunk egy szolgálati közleményt is.

Tovább

Melyik a gyorsabb: Union vagy OR?

Lejegyzetelem ide, hogy néha jobb eredményt ad ha a WHERE feltételben megadott szűréseket szétbontjuk, és két vagy több lekérdezés uniójával állítjuk elő. Mutatom. --Query 1 : OR SELECT * FROM Sales.SalesOrderDetailWHERE ProductID = 714 OR Product...

Tovább

NON EMPTY; NONEMPTYCROSSJOIN problémák

Lejegyzetelem ide, hogy a NONEMPTYCROSSJOIN (DimA.members, DimB.members, DimC.members)típusú lekérdezés emberi időben le se fut, de ha átírjuk ilyenre:NONEMPTY (DimA.members * DimB.members * DimC.members)Akkor pár másodperc alatt lefut.Chris Webb-...

Tovább

Hogyan kezeljük az időzónákat az adattárházban?

Adott egy multinacionális vállalat, amely eltérő időzónájú országokban is értékesít. A kérdés az, hogy milyen időponton szerepeltessük az eseményeket az adattárházban? Lokális, vagy valamilyen egyezményes időponton mint például az UTC? Ennek járunk most utána.

Tovább

SQL Server startup paraméterek adattárházas környezetben

BUÉK! Idén olyan helyen voltunk szilveszterezni, ahol nem volt térség, így nem tudtam publikálni a nagy gonddal megírt 2010-es évről szóló cikket. Ma, 2011-ben pedig már elszállt az ereje, úgyhogy BUÉK és csapjunk a lecsóba. A téma az SQL Server startup paraméterei adattárházas környezetben

Tovább

Barangolások a 4 Tera feletti adattárházak világában

Nemrég lehetőségem nyílt közelebbről is szemügyre venni egy Fast Track Data Warehouse referencia architektúra alapján összeállított adattárházat, és ennek tapasztalatairól szeretnék most beszámolni. Elsősorban arra keresem a választ, hogy mit tudunk átvenni a nagyoktól és mit tudunk a referencia architektúra ajánlásaiból használni akár kisebb méretekben is.

Tovább

A Microsoft referencia adattárház architektúrája

Nemrég jelent meg a Microsoft adattárház appliance-e, a Parallel Data Warehouse Edition és ennek kapcsán egy kicsit szemügyre vesszük a kistesót, a magyarországi méretekhez jobban passzoló 4-48 terára optimalizált Fast Track Data Warehouse referencia adattárház architektúrát.

Tovább

Tegyünk természetes kulcsot a ténytáblákba?

A tankönyvek szerint ne. Elmondom, hogy ennek ellenére mégis miért igen:1. Százszor egyszerűbb megoldani a mesterséges kulcsok kikeresését (lookup) a dimenziótáblából, ha a ténytáblában ott van a természetes kulcs2. Százszor egyszerűbb tesztelni, ...

Tovább

Hány kockát építhetünk egy adatbázisban?

Összesen 2^31-1 azaz kicsit több, mint kétmilliárd kockát építhetünk egy Analysis Services-en alapuló BI megoldásba. Jó tudni, nehogy a kockák gyártása közben véletlenül túlszaladjunk ezen a korláton. JAz Analysis Services felső korlátairól a Maxi...

Tovább

Egy nagy kocka vagy sok kicsi - A fejlesztői élmény

A múlt heti cikkben a „sok kis adatkocka vagy egy nagy” dilemmát az üzleti felhasználók oldaláról közelítettük meg. Azt vizsgáltuk, hogy a felhasználói élmény szempontjából melyik a jobb megoldás. Most átülünk a fejlesztők székébe és a technológia lehetőségei felöl közelítjük meg a problémát...

Tovább

Egy nagy kocka vagy sok kicsi - Tervezés

Most, hogy újra elolvastam az „Egy nagy adatkocka vagy sok kicsi - felhasználói élmény” című cikket, eszembe jutott még valami. Írom, hogy az üzleti felhasználók szempontjai miatt érdemes egy nagy kockában gondolkodni, de nem írtam arról, hogy hog...

Tovább

Egy nagy kocka vagy sok kicsi - A felhasználói élmény

Adatpiacok, vezetői információs rendszerek tervezése során gyakran felmerül a kérdés, hogy egy nagy adatkockát építsünk, vagy szakterületenként/üzleti folyamatonként egy-egy kicsit. A most következő cikkben ennek járunk utána, és első körben a felhasználók szempontjából vizsgáljuk meg a problémát

Tovább

Oldalak