Pokolba a csillagsémával
A csapból is az folyik, és én magma is veszettül hangoztatom, hogy Power BI-ban a datasetek/szemantikus modellek építésekor a csillagséma a legjobb megoldás.
De amivel nem tudok azonosulni, az a csillagséma egyetlen jó megoldásnak történő elfogadása. A minap például a szemem láttára koncoltak fel egy fejlesztőt, mert letért a csillagsémás útról egy olyan esetben, amikor a csillagséma nem adott jó megoldást. "Pokolba a csillagsémával, ha nem az adja a legjobb megoldást" - mondta.

A téma supply chain, a megrendelő azt szerette volna látni, hogy hány termék lett kiszállítva és hány termék lett visszahozva. Hogyan modellezzük ezt a csillagsémás módszertan szerint? Építünk egy Kiszállítás ténytáblát, és egy Visszáru ténytáblát majd összekötjük őket a közös dimenziótáblákkal.
Igenám, de mi van akkor ha az a fránya ügyfél rendelésenként akarja látni, hogy mennyi volt egy rendelésen a kiszállított és visszahozott mennyiség? Hogyan modellezzük ezt egy csillagsémával?
Ha kőkeményen ragaszkodunk a csillagsémás modellezés alapelveihez, akkor sehogy:
- Definíció szerint ténytáblát ténytáblával nem kötünk, azaz nem kötjük össze a kiszállítás és visszáru táblákat.
- Definíció szerint nem építünk olyan dimenziótáblát, amelyek elemszáma közel annyi, mint a ténytábla elemszáma vagy ahol a dimenzió tábla a ténytábla sebességével növekszik. Ennek következtében nem köthetjük össze a kiszállítás és visszáru ténytáblát a rendelésszám dimenziótáblával, mert a rendelésszám dimenzió tábla elemszáma közel azonos a kiszállítás ténytábla elemszámával.
Régen, amikor EGY csillagsémás adattárháza volt a vállalatnak, akkor erre adattárház szinten nem adtunk megoldást. „Oldja meg a BI eszköz” puffogtattuk. Adjuk a kiszállítást, adjuk a visszárut, oldja meg az adattárház feletti BI eszköz az összekötését.
De ez régen volt. Ma már nem vállalatonként építünk egy csillagsémát, hanem riportonként egyet. Ma már nem egy fejlesztőcsapat építi az adattárházat, hanem milliónyi felhasználó épít milliónyi „mini adattárházat”. És ebben a világban az adott riport/probléma megoldásához kell a legjobb adatmodellt megtalálni, és az lehet, hogy nem tisztán csillagsémás lesz...
Összefoglalva: Power BI-ban továbbra is a csillagséma adja a legjobb megoldást. Erre lett optimalizálva az adatbázis kezelő, ezt tudják legkönnyebben lekérdezni a felhasználók, erre könnyű megírni a DAX képleteket, stb. De vannak problémák, amire a csillagséma nem ad megoldást, vagy nem a csillagséma adja a lejobb megoldást, és ekkor nyugodtan le lehet térni a királyi útról. De csak ekkor és kizárólag ekkor. Mert azért a csillagséma a király :-)
Kővári Attila - BI projekt

POWER BI WORKSHOP
Tudjon meg többet az itt elhangzottakról! Jöjjön el a 2026. május 13.-i Power BI workshopra vagy rendeljen kihelyezett képzést! Részletek >>

POWER BI ADATMODELL TERVEZŐ WORKSHOP
Tudjon meg többet az itt elhangzottakról! Jöjjön el a 2026. május 14.-i Power BI adatmodell tervező tanfolyamra! Részletek >>

BI projekt: BI & DWH Tervezés, tanfolyam, tanácsadás - 


Új hozzászólás