Cikkek BI & DWH tervezőknek és fejlesztőknek

Az alábbi oldalon összeszedtem minden olyan infót, BI és adattárház oktató anyagot, amely a BI/adattárház bevezetések műszaki/technológiai oldalával foglalkozik és elsősorban leendő adattárház tervezők, architektek, fejlesztők és dba-k fognak belőle profitálni.

Könyvek

Az utóbbi időben rám a legnagyobb hatással az alábbi könyvek voltak:

Dan Linstedt: Building a Scalable Data Warehouse with Data Vault 2.0 című könyve. Szívből ajánlom azoknak is, akik nem Data Vault módszertan alapján modellezik adattárházukat.
Ralph Kimball: The Microsoft Data Warehouse Toolkit-jét szintén rongyosra olvastam anno. Aki csillagsémás adattárháztat épit Microsoft-os környezetben annak kötelező.

Adattárház tervezéssel és fejlesztéssel foglalkozó cikkek

Építsünk hierarchiákat?

Kővári Attila 2012. augusztus 21.

Most, hogy vége van a nyárnak ideje felpörögni. Az első bejegyzés a hierarchiák fontosságával illetve az alternatív hierarchiák megvalósítási lehetőségeivel fog foglalkozni.

Adattisztítás Microsoft BI eszközökkel

Kővári Attila 2012. július 4.

Az SQL Server 2012-ben debütált Data Quality Services-zel tovább nőtt az adattisztításra használható eszközeink száma, úgyhogy ideje áttekinteni az SQL Server adatminőség javítással kapcsolatos kínálatát.

2012-es PowerPivot for Excel újdonságok

Kővári Attila 2012. május 29.

Videó, 27 oldalas ingyenes tanulmány, workshop: Ezekkel a tartalmakkal tudok szolgálni azoknak, akiket érdekelnek az önkiszolgáló üzleti intelligencia és a PowerPivot for Excel újdonságai. Részletek a cikkben

SQL 2012 újdonságok a BI jegyzeteken

Kővári Attila 2012. március 19.

Úgy tervezem, hogy a hazai SQL Server 2012 bejelentésig minden nap bemutatok egy-egy SQL 2012 újdonságot a BI jegyzetek oldalon. Csak néhány szóban megemlítve, esetleg képekkel illusztrálva, linkekkel, kifejezetten technikai embereknek. Ha érdekli a téma, akkor olvassa el a részleteket.

Tegyünk logót a riportra?

Kővári Attila 2012. március 12.

Az egyik oldalról úgy gondolom, hogy ne, hiszen kerülni kell minden olyan grafikai elemet, ami elvonja az információ befogadójának figyelmét a riport mondanivalójáról, a másik oldalról viszont azt látom, hogy egy logó lehet bizalomépítő is. Jöjjenek az érvek…

Magyar nyelvi kérdések az SQL 2012 kapcsán

Kővári Attila 2012. január 25.

Felraktam az SQL Server 2012 RC0-át és a collation default beállítása Hungarian_CI_AS. Mutatom:Miért baj ez? Mert a Hungarian collation használja a dupla mássalhangzókat. Csakhogy szegén SQL Server nem tudja eldönteni, hogy pl. a „Táncstúdió” szav...

A PowerPivot memóriahasználatának optimalizálása

Kővári Attila 2011. december 12.

A most következő cikkben mutatok néhány trükköt, amivel csökkenthetjük a Microsoft oszlopalapú adatbázisának méretét, így biztosítva lehetőséget arra, hogy egy mezei pc-n is a demókon látható többtízmillió soros adatbázisokkal dolgozhassunk.

HR szakértő tanácsa BI szakembereknek

Kővári Attila 2011. október 24.

Az utóbbi időszakban egyre több HR szakértő szeretett volna kapcsolódni a LinkedIn-es közösségi hálómhoz. Sejtettem hogy miért, de mivel pontosan nem tudtam, ezért egyiküket megkérdeztem. Válaszolt, és a válasza nagyon meglepett…

Azt fejlesszük le amit kértek, vagy azt amit szeretnének?

Kővári Attila 2011. szeptember 19.

Egy BI projekt megvalósítása során sokszor a szállítónak kell döntenie arról, hogy egy scope-ban nem szereplő igényt lefejleszt-e a projekt terjedelmén belül vagy nem. Ha úgy dönt, hogy lefejleszti, akkor nagyon nem mindegy, hogy hogyan kommunikálja/kommunikáljuk mindezt.

Hogyan motiváljuk a tesztelőket?

Kővári Attila 2011. szeptember 1.

A felhasználók rendszerint nem azonos intenzitással tesztelnek a tesztidőszak alatt. Vannak akik magukénak érzik a dolgot és becsülettel tesztelnek, vannak akik az első megtalált hiba után ledobják a Riga láncot és addig nem folytatják a tesztet, amíg a hiba kijavításra nem kerül; vannak akik másra várnak és még sorolhatnám. A kérdés csak az: Hogyan motiváljuk a tesztelőket?

Csillag vagy hópehely séma?

Kővári Attila 2011. július 20.

Nagy általánosságban – és a legjobb gyakorlatoknak megfelelően – kerüljük a hópehelyséma használatát. Vannak azonban olyan esetek, amikor érdemes elgondolkodni a használatán. A cikkben ezen ritka esetekre kerestem egy-két példát

SQL Server elérése a loginok törlése után...

Kővári Attila 2011. július 18.

Hatalmas hibát követtem el a minap. Kitöröltem egy SQL cluster összes loginját. Rosszul állítottam össze egy drop-create scriprtet, ami kitörölte az összes logint. Közte a sajátomat is. Brrrr. Ott álltunk egy SQL Serverrel amihez gyakorlatilag sen...

Tegyünk elsődleges kulcsot a ténytáblákra?

Kővári Attila 2011. július 4.

Ne, mert Csak nagyobbá teszi a ténytáblát, És nem származik előnyünk egy ROWID típusú mesterséges kulcsból, indexbőlIgen, ha Pl. a riportkészítő eszköz megköveteli (mint pl. annak idején a ReportBuilder) Ha azonos soroka...

Miért gyorsak az OLAP adatbázis-kezelők?

Kővári Attila 2011. május 30.

Az OLAP adatbázis-kezelők gyorsaságának egyik oka az, hogy előre felaggregálják azokat az adatokat, amelyekről úgy gondolják, hogy szükségük lesz rájuk a felhasználóknak. A kérdés csak az, hogy honnan tudják, hogy mire lesz szükségük a felhasználóknak? A cikkben ezt a témát járjuk körbe, illetve a végén megosztunk egy szolgálati közleményt is.

Melyik a gyorsabb: Union vagy OR?

Kővári Attila 2011. május 24.

Lejegyzetelem ide, hogy néha jobb eredményt ad ha a WHERE feltételben megadott szűréseket szétbontjuk, és két vagy több lekérdezés uniójával állítjuk elő. Mutatom. --Query 1 : OR SELECT * FROM Sales.SalesOrderDetailWHERE ProductID = 714 OR Product...

MS BI és adattárház bevezetést támogató segédszoftverek II. rész

Kővári Attila 2011. április 27.

A BI és adattárház bevezetést támogató segédszoftverek ismertetését ezúttal a minőségbiztosítást, dokumentálást és üzemeltetést támogató ingyenesen letölthető segédszoftverek bemutatásával folytatjuk.

MS BI és adattárház bevezetést támogató segédszoftverek. I. rész

Kővári Attila 2011. április 18.

A most következő cikkben átnézzük mindazon ingyenesen letölthető segédszoftvereket, amelyeket évek óta, nap mint nap használunk adattárházak és BI rendszerek bevezetéséhez. Sok időt, energiát takarítottunk már meg velük, úgyhogy bízom benne, hogy hasznosak lesznek az Ön számára is.

NON EMPTY; NONEMPTYCROSSJOIN problémák

Kővári Attila 2011. április 13.

Lejegyzetelem ide, hogy a NONEMPTYCROSSJOIN (DimA.members, DimB.members, DimC.members)típusú lekérdezés emberi időben le se fut, de ha átírjuk ilyenre:NONEMPTY (DimA.members * DimB.members * DimC.members)Akkor pár másodperc alatt lefut.Chris Webb-...

Hogyan kezeljük az időzónákat az adattárházban?

Kővári Attila 2011. március 16.

Adott egy multinacionális vállalat, amely eltérő időzónájú országokban is értékesít. A kérdés az, hogy milyen időponton szerepeltessük az eseményeket az adattárházban? Lokális, vagy valamilyen egyezményes időponton mint például az UTC? Ennek járunk most utána.

Fast Track Data Warehouse 3.0 referencia adattárház architektúra

Kővári Attila 2011. február 15.

Tegnap a TDWI Word Conference-en jelentette be a Microsoft a Fast Track Data Warehouse referencia adattárház architektúra 3.0-ás változatát. A referencia architektúra alapján felépített adattárházak immár 80 Teráig skálázhatóak egy 8 processzoros ...

SQL Server startup paraméterek adattárházas környezetben

Kővári Attila 2011. január 10.

BUÉK! Idén olyan helyen voltunk szilveszterezni, ahol nem volt térség, így nem tudtam publikálni a nagy gonddal megírt 2010-es évről szóló cikket. Ma, 2011-ben pedig már elszállt az ereje, úgyhogy BUÉK és csapjunk a lecsóba. A téma az SQL Server startup paraméterei adattárházas környezetben

Hogyan mozog a lemezen a fej, ha két user is ugyanazt a táblát kérdezi le?

Kővári Attila 2010. december 16.

A 4 Tera fölötti adattárházakról szóló cikk írása közben gondolkodtam azon, hogy mit csinál a fej akkor ha két felhasználó ugyanazt a táblát kérdezi le?Tegyük fel, hogy UserA lekérdez egy teljes táblát, majd kis idő elteltével UserB is lekérdezi u...

Barangolások a 4 Tera feletti adattárházak világában

Kővári Attila 2010. december 14.

Nemrég lehetőségem nyílt közelebbről is szemügyre venni egy Fast Track Data Warehouse referencia architektúra alapján összeállított adattárházat, és ennek tapasztalatairól szeretnék most beszámolni. Elsősorban arra keresem a választ, hogy mit tudunk átvenni a nagyoktól és mit tudunk a referencia architektúra ajánlásaiból használni akár kisebb méretekben is.

A Microsoft referencia adattárház architektúrája

Kővári Attila 2010. november 30.

Nemrég jelent meg a Microsoft adattárház appliance-e, a Parallel Data Warehouse Edition és ennek kapcsán egy kicsit szemügyre vesszük a kistesót, a magyarországi méretekhez jobban passzoló 4-48 terára optimalizált Fast Track Data Warehouse referencia adattárház architektúrát.

Attila! Szólj a fejlesztőknek hogy lassú az Excel

Kővári Attila 2010. november 28.

Olvasom Kasper De Jonge 10 jótanácsát a PowerPivothoz, és olvasom, hogy mennyire fontos a meglévő kapcsolatok használata az adatbázisokhoz történő kapcsolódáskor. Nincs ez máshogy az Excel 2007 esetén sem. Ha a felhasználók arról panaszkodnak, hog...

Tegyünk természetes kulcsot a ténytáblákba?

Kővári Attila 2010. november 12.

A tankönyvek szerint ne. Elmondom, hogy ennek ellenére mégis miért igen:1. Százszor egyszerűbb megoldani a mesterséges kulcsok kikeresését (lookup) a dimenziótáblából, ha a ténytáblában ott van a természetes kulcs2. Százszor egyszerűbb tesztelni, ...

Hány kockát építhetünk egy adatbázisban?

Kővári Attila 2010. november 9.

Összesen 2^31-1 azaz kicsit több, mint kétmilliárd kockát építhetünk egy Analysis Services-en alapuló BI megoldásba. Jó tudni, nehogy a kockák gyártása közben véletlenül túlszaladjunk ezen a korláton. JAz Analysis Services felső korlátairól a Maxi...

Egy nagy kocka vagy sok kicsi - A fejlesztői élmény

Kővári Attila 2010. szeptember 20.

A múlt heti cikkben a „sok kis adatkocka vagy egy nagy” dilemmát az üzleti felhasználók oldaláról közelítettük meg. Azt vizsgáltuk, hogy a felhasználói élmény szempontjából melyik a jobb megoldás. Most átülünk a fejlesztők székébe és a technológia lehetőségei felöl közelítjük meg a problémát...

Egy nagy kocka vagy sok kicsi - Tervezés

Kővári Attila 2010. szeptember 13.

Most, hogy újra elolvastam az „Egy nagy adatkocka vagy sok kicsi - felhasználói élmény” című cikket, eszembe jutott még valami. Írom, hogy az üzleti felhasználók szempontjai miatt érdemes egy nagy kockában gondolkodni, de nem írtam arról, hogy hog...

Egy nagy kocka vagy sok kicsi - A felhasználói élmény

Kővári Attila 2010. szeptember 11.

Adatpiacok, vezetői információs rendszerek tervezése során gyakran felmerül a kérdés, hogy egy nagy adatkockát építsünk, vagy szakterületenként/üzleti folyamatonként egy-egy kicsit. A most következő cikkben ennek járunk utána, és első körben a felhasználók szempontjából vizsgáljuk meg a problémát

Oldalak