Adattárház könyvek: Általános adattárház elmélet

A most következő cikkben megnézzük az új Kimball könyvet és ejtünk néhány szót a hazai és külföldi adattárház irodalomról is. Kezdjünk rögtön az új Kimball adattárház könyvvel:

The Kimball Group Reader

Első benyomás

Februárban ezt jegyzeteltem le a könyvről:

Meghozta a posta az Amazonon rendelt új Kimball adattárház könyvet. Úgy bontottam fel, mint az óvodás az ajándékot: tele izgalommal, hogy vajon mi lehet benne?

The Kimball Group Reader

Aztán jött a döbbenet. Kimball ugyanis nem csinált mást, mint az interneten elérhető cikkeit kinyomtatta, régi könyveiből hozzáadott némi elméleti alapot, becsomagolta az egészet egy könyvbe, oszt csókolom.

Aki fel van iratkozva hírlevelére és kapja a Design tippjeit, aki olvasta/olvassa az Intelligent Enterprise-ban megjelent írásait, az ne számítson semmi újra. Nem olvastam végig a 700 oldalt, de az a benyomásom, hogy ezeket már olvastam, vagy olvashattam volna az alábbi oldalak valamelyikén:

Persze ettől még jó a könyv. Jó, hogy az interneten írt publikációit tematikusan is tudom keresni, jó hogy egy-egy témának ebben a könyvben is utána tudok nézni. Nem bántam meg, hogy megvettem, csak most egy kicsit le vagyok hangolódva, mert másra számítottam.

Fél év használat után

Fél év használat után - várakozásaimmal ellentétben - a könyvet nagyon gyakran forgatom. Ha van egy speciális problémám, amire nincs rutinmegoldás, akkor előveszem a könyvet és megnézem, hogy Kimballék hogyan vélekednek a témáról. Még akkor is, ha fejben már összeállt minden. Teszem ezt egyrészről azért, mert kíváncsi vagyok rá, hogy más is erre a következtetésre jutott-e, másrészről pedig azért mert ilyenkor vagyok fogékony a problémához kapcsolódó problémák megismerésére.

Kimball korábbi adattárház könyveivel összehasonlítva ez a leggyakorlatiasabb könyv. Míg a korábbi munkái inkább elméletiek voltak addig a Group Reader inkább a kivételeket tartalmazza: Azokat az eseteket, amikor az elmélet nem igazán működik, vagy nem igazán tudjuk hogyan lehet megvalósítani a gyakorlatban.

Kimball korábbi adattárház könyvei.

Amikor valakinek ajánlok egy Kimball könyvet, akkor rendszerint visszakérdez, hogy „de hát ezek több mint 10 éves könyvek. Nem avultak még el?"

Nem. Egy projektnek ugyanolyan fázisai vannak, egy adatmodellt ugyanúgy kell tervezni, mint 10-15 éve. Persze vannak változások. Ma már nem annyira drága az adattárolás, mint 10-15 éve, ma már kisebb vállalatoknak is elérhető a technológia, stb. Ezek mind-mind hatással vannak az adattárház építésre, de az alapok változatlanok.

Top 2

Ha csak két könyvet ajánlhatnék általános adattárház témában, akkor azok a következőek lennének:

  • The Data Warehouse Toolkit: Könyv a dimenzionális adatmodell tervezéshez. Típuseseteket, típusvállalatokat ír le és rajtuk keresztül mutatja be a csillagsémás adatmodell tervezés csínját-bínját. Elsősorban azoknak javaslom, akik adatmodellt szeretnének tervezni.

The Data Warehouse Toolkit

  • The Data Warehouse Lifecycle Toolkit: Az adattárház bevezetés módszertanát leíró könyv. Bemutatja a projekt fázisait kezdve az igényfelméréstől egészen az üzemeltetésig. Ha az adattárház bevezetés folyamata érdekli, akkor erre a könyvre lesz szüksége

The Data Warehouse Lifecycle Toolkit

Kimball további könyvei is jók, de azokat nem nagyon forgatom. A Webhouse toolkit-et azért nem mert nem építettem még Data Webhouse-t, az ETL Toolkit-et pedig nem tudom miért nem, de nem nagyon lapozgatom. A Microsoft Data Warehouse toolkit pedig az egyik legolvasottabb Kimball könyvem közé tartozik, de erről majd fogok írni részletesen is.

Bill Inmon adattárház könyvei

Inmon könyveit is ritkán forgatom. Ennek legfőképpen az az oka, hogy elsősorban csillagsémás adattárházakkal foglalkozom, és Inmon munkássága ezt a területet épphogy csak érinti.

Mindazonáltal meg kell említeni, hogy az adattárház szakmának nem csak a Kimball-i útja létezik. Sőt. Aki ezen a területen először nagyot alkotott az Inmon volt, hiszen neki jelent meg először könyve az adattárházakról. A teljes képhez tehát szükséges a normalizált adattárházak ismerete is, melyeket Inmon könyveiből lehet legjobban megismerni.

Más külföldi szerzők adattárház könyvei

Másoktól nem nagyon találtam jó könyvet. Vannak könyvek, amelyekbe néha belelapozok, de azt csak szakmai kíváncsiságból teszem. (Kíváncsi vagyok hogyan dolgoznak fel mások egy-egy problémát, milyen módszertant alkalmaznak, stb.)

Magyar adattárház könyvek

Háát, magyar adattárház könyvekkel nem állunk túl jól. Pedig megveszek minden könyvet amire rá van írva, hogy adattárház, döntéstámogatás, vagy bármilyen üzleti intelligenciához kapcsolható szakszó, de ezek a könyvek sajnos egytől egyig csalódást okoztak. Általában külföldi marketing anyagokból lefordított, vagy annyira általános irodalmak, a valóságtól annyira el vannak rugaszkodva, hogy adattárház építéshez nem nagyon tudjuk őket használni.

Nem tartozik szorosan a témához, de el kell, hogy mondjam, hogy ugyanakkor nagyon szeretem az adatbányászattal kapcsolatos magyar könyveket. (Nem az angolról fordítottakat, hanem a magyar szerzők által írottakat)

Frissítés: A kommentek között Gáspár-Papanek Csaba részletesen bemutatja a magyar adatbányász könyveket. Tekintse meg őket.

Összefoglalva: Csillagsémás adattárház témában tehát a The Data Warehouse Lifecycle Toolkit, a The Data Warehouse Toolkit, és a The Kimball Group Reader könyveket ajánlom a legszívesebben. Ezek persze a személyes preferenciáim, de úgy gondolom, hogy másoknak is ezek lesznek azok a könyvek amelyek segítséget fognak nyújtani a szakmai fejlődéshez.

A bejegyzés következő részében átmegyünk a fizikai megvalósítás vonalára és megpróbálok azoknak is segíteni, akik Microsoft témában keresnek adattárház könyveket.

Tovább a Microsoft adattárház könyvekhez >>

Kővári Attila - BI projekt

hozzászólás

Kedves Attila! Ha már ennyire nincs magyar BI irodalom, miért nem írsz egyet Te? Szerintem mindnyájan jobban járnánk! Üdvözlettel

Kedves Attila! Írod: "nagyon szeretem az adatbányászattal kapcsolatos magyar könyveket". Melyek ezek? Miért jók? Üdv egy másik Attila

Igen, én is kíváncsi vagyok, hogy mely adatbányászati könyveket szereted. Üdvözlettel: Ameliox

Összesen 4 könyvet olvastam a témában. Ebből egy magyarra fordított könyv (Adatbányászat – koncepciók és technikák) a másik három magyar szerzők munkái (Tikk Domonkos: Szövegbányászat; Fajszi Bulcsú – Cser László: Üzleti tudás az adatok mélyén; Fajszi Bulcsú – Cser László – Fehér Tamás: Üzleti haszon az adatok mélyén) Mi fogott meg bennük? A probléma, amiről írnak. Tudnod kell, hogy csak műkedvelőként olvasgatom ezeket a könyveket, és a megoldásról nem tudom eldönteni, hogy jók-e. Nekem arra mindenképpen jók, hogy megismerjem belőlük a problémákat. És igazából ezt szeretem bennük: Az üzleti problémákat. De kérdezzük meg az adatbányász olvasókat, hogy szerintük melyek a jó, gyakorlatban is használható adatbányász könyvek?

Szia Sándor, A könyvírásnak még nem jött el az ideje. Talán majd pár év múlva :-)

Mikor valaki adatbányászati könyvet szeretne találni magának, mindig vissza szoktam kérdezni, hogy milyen aspektusból közelít a dologhoz. Kevés a magyar nyelvű munka (Attila majd mindet felsorolta), én az alábbi elvek szerint ajánlanám őket: - Üzleti haszon az adatok mélyén (Fajszi Bulcsú, Cser László, Fehér Tamás) - Inkább azoknak ajánlom, akik az adatbányászati problémák felismerésére, az adatbányászokkal való közös nyelv kialakítására vágynak. Akik művelni szeretnék ezt a szakmát, azoknak, azoknak inkább azért javaslom, hogy lássák, mennyit tudhat az üzleti oldal, ha nagyon tájékozódott. Van egy korábbi könyvük a szerzőknek: Üzleti tudása az adatok mélyén. Kevésbé kiforrott mű, inkább akkor vegyed a kezedbe, ha nincs sok időd - ez ugyanis jóval rövidebb. - Adatbányászat - Koncepciók és technikák (Jiawei Han) - Elég régi könyv, ma már nem is igazán ajánlom. Az adatbányászat kialakulásakor nagyon jelentős műnek volt mondható, szerintem a mai üzleti és szakmai világ már túlhaladt rajta. - Adatbányászat a hatékonyság eszköze (Dr. Abonyi János) - Azoknak, akik művelni szeretnék az adatbányászatot, jó kiindulópont. Meg lehet tanulni belőle a különböző módszereket, de ilyen értelemben jó tankönyv. De szemlélet szempontjából nagyon keveset ad. - Adatbányászati algoritmusok - Bodon Ferenc (weben elérhető egyetemi jegyzet) - Csak a legelszántabbaknak, kezdésre semmiképpen nem ajánlom. Főleg a dolog mély matematikai részére koncentrál, bár vannak olyan fejezetei is, ami általánosabb bevezetőt takar. - Szövegbányászat - Tikk Domonkos - Jó könyv, de nem adatbányászattal, hanem szövegbányászattal foglalkozik. Inkább azoknak ajánlom - de azoknak nagyon - akik már adatbányászattal tisztában vannak, vagy akik direkte a szövegbányászatra szeretnének specializálódni. Azoknak is érték lehet néhány fejezete, akik üzleti oldalról ugranak bele a témába. - Van még néhány magyar nyelvű könyv, de ezek elég régiek, és - mondjuk igy - igen szerény színvonalúak, ezeket semmiképpen nem ajánlom. Üzleti és algoritmikai szempontból vannak jó könyvek, de szemléletet tanító műből magyarul még nincs, angolul is párját ritkítja a dolog. Én egyet ismerek csak: Larose, Discovering Knowledge in Data. Kevés algoritmus, kevés üzleti rész, de sok gyakorlati elemzés és elgondolkodtató gondolat, ami alapján valamifajta szemléletre is szert lehet tenni.

Köszönön szépen a minden igényt kielégítő listát!

Sziasztok! Olyan könyvet tudtok ajánlani ami az adattárház üzemeletetésével kapcsolatos? Linux rendszerre lett átköltöztetve microsoft-ról és az egész üzemeltetésbe úgy kerültem bele, hogy előtte csak halottam valamit erről az egészről. Segítséget előre is köszönöm. Üdv: István

Új hozzászólás