Power BI Data Catalog


A Microsoft önkiszolgáló ETL eszközének (Power Query) van egy új, Data Catalog nevű szolgáltatása, amely segítségével az elemzők adattranszformációkat tudnak megosztani egymással úgy, hogy a transzformációt minden elemző mint adatforrás látja. Írtam erről részletesen egy több cikkből álló sorozatot a BI jegyzetek blogban, de aki lemaradt volna róla az most röviden elolvashatja az összefoglalást.

Amikor először hallottam a szolgáltatásról, nagyon megörültem: Végre vége lehet annak a korszaknak, amikor az elemzők adatokat küldözgettek egymásnak és beléphetünk egy olyan korba, amikor az adat helyet annak előállítási módja cserél gazdát.

Bíztam abban is, hogy vége lehet az e-mail csatolmányokban küldözgetett Excel fájlos korszaknak, amikor minden hónapban újabb és újabb Excel fájlok repültek ki postaládákba függetlenül attól, hogy használta-e valaki az adatot vagy sem.

És végül bíztam abban, hogy jelentősen csökkenhetnek a verziózási problémák és a létszám_2014_végleges ezt_használd_jó (final)_Marcsitól_Kaptam_jan16.xlsx helyett csak a létszám.xlsx-et kell majd használnia mindenkinek.

Most, hogy jó néhány felhasználási szcenáriót kipróbáltam a Data Cataloggal kiderült, hogy – bár az irány továbbra is nagyon jó – de az első verziós szolgáltatásnak vannak még olyan hiányosságai, amelyek az elterjedést lassítják.

  • Minden olyan felhasználónak szüksége van Power BI előfizetésre, akik használni akarják a szolgáltatást. Tehát nem csak azoknak, akik a BI-t szeretnék használni, hanem azoknak is, akik az adatgazdák által megosztott lekérdezést szeretnék használni. Ez pedig gyakorlatilag lehetetlenné teszi a széles körű elterjedését, hiszen a vállalat összes munkavállalója sosem lesz majd lefedve Power BI licensszel
  • A megosztott lekérdezés a Data Catalogban csak akkor módosítható, ha megvan az az Excel fájl, amelyből a transzformációt megosztottuk. Tehát hiába van egy központilag tárolt adatkatalógusunk, ettől függetlenül meg kell tartanunk azokat az Exceleket is amelyek az eredeti transzformációt tartalmazták
  • A megosztott lekérdezés változásai nem szinkronizálódnak le a megosztott lekérdezést használó Excel fájlokba, hiszen a megosztott lekérdezés elérési helye helyett a megosztott lekérdezés szkriptje mentődik bele az Excel fájlba. Ez pedig ellehetetleníti az adatgazdák azon törekvéseit, hogy ha megváltozik az adat előállítás módja, akkor az automatikusan leszinkronizálódjon a felhasználókhoz.

Remélem, hogy ezeket a gyerekbetegségeket hamar kinövi a Power Query Data Catalogja mert az elképzelés nagyon jó. Olyan utat nyithat majd meg, amely jelentősen csökkentheti a vállalatoknál kialakult kreatív káoszt. De ehhez még egy kicsit csiszolni kell a technológián és a licenszelésen...

Kapcsolódó anyagok:

Elválasztó

Már készül a következő cikk. Kérjen értesítést a megjelenéséről itt.

|

Szóljon hozzá!

Szabály: Legyen kedves, segítõkész és vállalja a nevét.
A mező tartalma nem nyilvános.
  • A web és email címek automatikusan linkekké alakulnak.
  • Engedélyezett HTML elemek: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • A sorokat és bekezdéseket automatikusan felismeri a rendszer.
ANTI SPAM
A robot regisztrációk elkerülésére.
Image CAPTCHA
Figyeljen a kis és nagybetűk használatára