Relációs adattárház

A relációs adattárházak világával foglalkozó szakcikkek

Összeérő idősort építsünk az adattárházban?

Az adattárházak historizáltak, azaz az adattárház minden egyes soráról meg tudjuk állapítani, hogy az mettől meddig volt érvényes. Tegyük fel hogy az érvényesség kezdetét a ValidFrom, a végét a ValidTo oszlopokban tároljuk. Kérdés: A korábbi rekord ValidTo-ja egyezzen a későbbi rekord ValidFrom-jával, vagy legyen közte egy miliszekundum rés? Másképpen fogalmazva összeérő idősort építsünk, vagy inkább össze nem érőt? A válasz kiderül a cikkből...

Tovább

Gyorsan változó szervezeti egységek BI stratégiája

A gyorsan növő/változó szervezeti egységek jellemzője, hogy mindent kinőnek, mindent folyamatosan változtatnak. Változnak a célok, napról napra változnak a prioritások és az igazságnak nem egy verziója van. Illetve pontosítok: Az igazságnak mindig van egy verziója, de ez időről időre változik :-) Hogyan érdemes egy ilyen gyorsan növő/változó szervezet információigényét kielégíteni? Erről szól a cikk...

Tovább

GRAPHISOFT BI és adattárház esettanulmány

A GRAPHISOFT-nál a BI bevezetés indikátora ugyanaz volt, mint bármely más hasonló cég esetében: Hozzáférést szerettek volna kapni saját adataikhoz. Nem riportokra vágytak, hanem egy adattárházra, amelyből minden kérdésükre nagyon rövid időn belül választ kaphatnak. Ebben eddig nincs semmi különös. Abban azonban már igen, ahogyan az adattárházukat fel akarták építeni. Ők ugyanis saját maguk szerették volna felépíteni a világ minden tájáról táplált, budapesti központú adattárházukat. Nem szállítót vagy erőforrást kerestek a probléma megoldásra, hanem szaktudást. Így találtunk egymásra 2012 tavaszán...

Tovább

UPC BI esettanulmány

A UPC-s BI projektet anno nagyon szerettem volna megnyerni… Megnyertük. Aztán megcsináltuk. Ma pedig ott tartunk, hogy esettanulmány is készült belőle. Olvassa el. Sokat tanulhat belőle és betekinthet a kulisszák mögé, amire ritkán nyílik csak lehetőség.

Tovább

MS BI és adattárház best practice cikkek

A most következő cikkel az a célom, hogy bemutassam a legjobb best practice tanulmányokat és ezáltal segítsek az adattárház fejlesztőknek, hogy jó, szerethető és sikeres BI rendszereket vagy adattárházakat építsenek. Olyanokat amelyre évek múltán visszatekintve is büszkék lesznek. És nem csak ők, hanem a megrendelőik is.

Tovább

Csillag vagy hópehely séma?

Nagy általánosságban – és a legjobb gyakorlatoknak megfelelően – kerüljük a hópehelyséma használatát. Vannak azonban olyan esetek, amikor érdemes elgondolkodni a használatán. A cikkben ezen ritka esetekre kerestem egy-két példát

Tovább

Hogyan kezeljük az időzónákat az adattárházban?

Adott egy multinacionális vállalat, amely eltérő időzónájú országokban is értékesít. A kérdés az, hogy milyen időponton szerepeltessük az eseményeket az adattárházban? Lokális, vagy valamilyen egyezményes időponton mint például az UTC? Ennek járunk most utána.

Tovább

SQL Server startup paraméterek adattárházas környezetben

BUÉK! Idén olyan helyen voltunk szilveszterezni, ahol nem volt térség, így nem tudtam publikálni a nagy gonddal megírt 2010-es évről szóló cikket. Ma, 2011-ben pedig már elszállt az ereje, úgyhogy BUÉK és csapjunk a lecsóba. A téma az SQL Server startup paraméterei adattárházas környezetben

Tovább

Barangolások a 4 Tera feletti adattárházak világában

Nemrég lehetőségem nyílt közelebbről is szemügyre venni egy Fast Track Data Warehouse referencia architektúra alapján összeállított adattárházat, és ennek tapasztalatairól szeretnék most beszámolni. Elsősorban arra keresem a választ, hogy mit tudunk átvenni a nagyoktól és mit tudunk a referencia architektúra ajánlásaiból használni akár kisebb méretekben is.

Tovább

A Microsoft referencia adattárház architektúrája

Nemrég jelent meg a Microsoft adattárház appliance-e, a Parallel Data Warehouse Edition és ennek kapcsán egy kicsit szemügyre vesszük a kistesót, a magyarországi méretekhez jobban passzoló 4-48 terára optimalizált Fast Track Data Warehouse referencia adattárház architektúrát.

Tovább

Szülő/gyerek hierarchiák historizálása

A könnyedebb témákról átmegyünk egy kicsit az adattárház adatmodell tervezési kérdéseire, és megvizsgáljuk, hogy milyen lehetőségeink vannak a szervezet/dolgozók/üzletkötők, ... típusú hierarchiák modellezésére.

Tovább

Adattárház könyvek: Microsoft adattárházak

Amíg csak adattárház elméletről, módszertanról keresünk könyvet addig viszonylag egyszerű dolgunk van: ki kell választanunk egyet Inmon vagy Kimball könyvei közül, és kész. Nem nagyon tudunk mellényúlni. Ha azonban olyan könyvet keresünk, amely megmutatja azt is, hogy hogyan kell felépíteni egy adattárházat a rendelkezésre álló Microsoft szoftverek felhasználásával, akkor már komoly problémákba ütközünk. Túl sok könyv létezik ugyanis, és ezek közül nehéz kiválasztani azt, amely valóban segíteni tud egy adattárház felépítésében. Ebben próbálok most segíteni

Tovább

Adattárház könyvek: Általános adattárház elmélet

Még februárban kezdtem el írni egy cikket annak apropóján, hogy Kimball-nak új adattárház könyve jelent meg, de végül nem publikáltam. Nem publikáltam, mert 1) akartam még érlelni egy kicsit az első benyomásaimat 2) írni akartam még azokról az adattárház könyvekről is, amelyekről azt gondolom, hogy segítséget fognak nyújtani másoknak is. Ezek következnek most.

Tovább

Real Time Data Warehousing

Az IBM és a Netezza szerint a másodpercen belüli késleltetésű adattárházak megvalósítása szinte lehetetlen, 5 másodperces késés nagy hardverberuházások segítségével megoldható és a 15 perces késleltetésű adattárházak megvalósítása rutinfeladat.

Tovább

Tegyünk idegen kulcsot a csillagsémára?

Megmondom őszintén én nem szoktam soha. Régen úgy tanultam, hogy feleslegesen terheli a procit, hogy az integritás biztosiasa az ETL folyamatok feladata, stb. De most olvastam egy internetes közvélemény kutatást (Nem reprezentatív!), amiből az der...

Tovább

Stabilizáció

Nem, most nem a válságról lesz szó, hanem egy olyan adattárház építési feladatról, amely nagyon fontos, mégis sokszor kimarad az adattárház projektek scope-jából. A téma aktualitását pedig az a projektünk adja, ahol az adattárház feltöltésének időszükséglete a vártnál rosszabbra sikerült.

Tovább

Az adatmodell tervezés folyamata - A fizikai adatmodell

Az adattárház lelke az adatmodell. Ha az jó, akkor az adattárház felhasználói szeretni fogják az adattárházat. Ha nem, akkor az adattárház szép lassan el fog halni. Ennek az adatmodellnek a sikeressége elsősorban két dologtól függ: Egyrészt attól, hogy az adatmodell „üzletileg” mennyire jó másrészt attól, hogy az adatmodell fizikai valójában mennyire hatékonyan támogatja azt, amit az üzleti terület megálmodott. Jelen cikk ez utóbbiról, a fizikai adatmodell tervezésről fog szólni.

Tovább

Miért használjunk mesterséges kulcsot a dátum dimenzióban?

Adattárházak betöltése során a forrásrendszerekben tárolt természetes azonosítókat (pl vevőkód, cikkszám, számlaszám, …) betöltés közben lecseréljük jelentés nélküli mesterséges azonosítókra, és utána ezen mesterséges azonosítókat használjuk a dimenzió- és ténytáblák közti kapcsolat megteremtésére. Miért tesszük mindezt és a válasz ismeretében vajon érdemes-e minden természetes azonosítót, így például a dátumokat is lecserélni jelentés nélküli mesterséges azonosítókra? A cikkből mindezen kérdésekre választ kaphat

Tovább

Újdonságok 2010-re: Kilimandzsáró, Madison, és Gemini

2 fontos újdonságot is bejelentettek az idei MS üzleti intelligencia konferencián: Az egyik a masszívan párhuzamosított architektúrára épülő, oldalra skálázott verziója az SQL szervernek, a másik az oszlop orientált, memória alapú tárolási módja az Analysis Services-nek. A cikkben megpróbálom elmagyarázni, hogy mit is jelentenek ezek.

Tovább

A Microsoft felvásárolta a DATAllegro-t

Microsoft felvásárolta az óriás adattárházak építésére szakosodott DATAllegro-t, így a tervek szerint a közeljövőben költséghatékonyan építhetünk akár több 100(!) terabájtos SQL Server alapú adattárházakat is.

Tovább

Oldalak