Power BI Data Catalog
A Microsoft önkiszolgáló ETL eszközének (Power Query) van egy új, Data Catalog nevű szolgáltatása, amely segítségével az elemzők adattranszformációkat tudnak megosztani egymással úgy, hogy a transzformációt minden elemző mint adatforrás látja. Írtam erről részletesen egy több cikkből álló sorozatot a BI jegyzetek blogban, de aki lemaradt volna róla az most röviden elolvashatja az összefoglalást.
Amikor először hallottam a szolgáltatásról, nagyon megörültem: Végre vége lehet annak a korszaknak, amikor az elemzők adatokat küldözgettek egymásnak és beléphetünk egy olyan korba, amikor az adat helyet annak előállítási módja cserél gazdát.
Bíztam abban is, hogy vége lehet az e-mail csatolmányokban küldözgetett Excel fájlos korszaknak, amikor minden hónapban újabb és újabb Excel fájlok repültek ki postaládákba függetlenül attól, hogy használta-e valaki az adatot vagy sem.
És végül bíztam abban, hogy jelentősen csökkenhetnek a verziózási problémák és a létszám_2014_végleges ezt_használd_jó (final)_Marcsitól_Kaptam_jan16.xlsx helyett csak a létszám.xlsx-et kell majd használnia mindenkinek.
Most, hogy jó néhány felhasználási szcenáriót kipróbáltam a Data Cataloggal kiderült, hogy – bár az irány továbbra is nagyon jó – de az első verziós szolgáltatásnak vannak még olyan hiányosságai, amelyek az elterjedést lassítják.
- Minden olyan felhasználónak szüksége van Power BI előfizetésre, akik használni akarják a szolgáltatást. Tehát nem csak azoknak, akik a BI-t szeretnék használni, hanem azoknak is, akik az adatgazdák által megosztott lekérdezést szeretnék használni. Ez pedig gyakorlatilag lehetetlenné teszi a széles körű elterjedését, hiszen a vállalat összes munkavállalója sosem lesz majd lefedve Power BI licensszel
- A megosztott lekérdezés a Data Catalogban csak akkor módosítható, ha megvan az az Excel fájl, amelyből a transzformációt megosztottuk. Tehát hiába van egy központilag tárolt adatkatalógusunk, ettől függetlenül meg kell tartanunk azokat az Exceleket is amelyek az eredeti transzformációt tartalmazták
- A megosztott lekérdezés változásai nem szinkronizálódnak le a megosztott lekérdezést használó Excel fájlokba, hiszen a megosztott lekérdezés elérési helye helyett a megosztott lekérdezés szkriptje mentődik bele az Excel fájlba. Ez pedig ellehetetleníti az adatgazdák azon törekvéseit, hogy ha megváltozik az adat előállítás módja, akkor az automatikusan leszinkronizálódjon a felhasználókhoz.
Remélem, hogy ezeket a gyerekbetegségeket hamar kinövi a Power Query Data Catalogja mert az elképzelés nagyon jó. Olyan utat nyithat majd meg, amely jelentősen csökkentheti a vállalatoknál kialakult kreatív káoszt. De ehhez még egy kicsit csiszolni kell a technológián és a licenszelésen...
Kapcsolódó anyagok:
Kővári Attila - BI projekt
POWER BI WORKSHOP
Tudjon meg többet az itt elhangzottakról! Jöjjön el a 2024. január 24.-i Power BI workshopra vagy rendeljen kihelyezett képzést! Részletek >>
Új hozzászólás