Meg nem történt események tárolása

Ha kinyitjuk bármelyik nagy adattárház guru könyvét, akkor rögtön a könyv elején elolvashatjuk, hogy a meg nem történt eseményeket nem tároljuk. Nem tároljuk például azt, hogy szombaton nem vásárolt senki. Csak azt tároljuk, ha valaki vásárolt. Olyan axiómája volt ez az adattárház építési módszertanoknak, amelyeket előszeretettel alkalmaztunk.

A Big Data technológiák megjelenése azonban teljesen felrúgta ezt az axiómát és lehetővé tette, hogy a meg nem történt eseményeket is tároljuk. Tény, hogy az elemzőket továbbra is az érdekli elsősorban, hogy ki mit vásárolt (Mit adtunk el?), de ha erre a kérdésre megkapják a választ, akkor jön a következő kérdés: Ki mit nem vásárolt? (Miért nem vásárolt?).

Gondoljon például egy ajánlórendszerre ahol legalább annyira fontos az, hogy az ajánlatok közül mit választott az ügyfél, mint az hogy mit nem. Vagy gondoljon például egy vállalat webes értékesítési rendszerére, ahol az ügyfél rákeres egy konkrét termékre vagy szolgáltatásra, de aztán nem vásárol semmit. Miért nem vásárolt? Milyen termékeket látott az első oldalon? Milyen áron látta a termékeket? Milyen sorrendben jelentek meg neki a termékek?

Mind-mind olyan kérdés, amelyet nem lehet megválaszolni anélkül hogy ne tárolnánk a mit nem vett eseményeket...

Amikor a Big Data használati lehetőségeit keressük egy „hagyományos” nagyvállalatnál, akkor pont az ilyen új területek lehetnek érdekesek. A ki mit vásárolt kérdésre megkapjuk a választ régóta a hagyományos technológiákkal, nincs értelme Big Datában gondolkodni. De a ki mit nem vásárolt kérdés megválaszolására még új terület. Nincsenek róla adataink és a hagyományos technológiákkal valószínűleg csak nagyon drágán tudnánk gyűjteni, tárolni azokat.

Ha nyitni akar a vállalatánál a Big Data felé, akkor elsősorban az ilyen kiaknázatlan területeket keresse. Olyan logok, adatok után kutasson, amelyeket eddig nem tároltak, vagy nem tároltak 15 másodpercnél tovább, de lehet üzleti hasznuk. Ezek tárolása, majd későbbi elemzése hozhatja meg a várt sikert.

Kővári Attila - BI projekt

BI & DWH projektvezető képzés

Tudjon meg többet az itt elhangzottakról! Jöjjön el a 2024. szeptember 25.-i BI és adattárház projektvezető képzésre, vagy rendeljen kihelyezett tanfolyamot! Részletek >>

 

hozzászólás

Nekem ez nem annyira jött át. A mit nem vásárolt kérdésre tudunk azzal válaszolni, hogy a teljes halmazból (amit tárolunk) kivonjuk a vásárlás halmazát (amit szintén tárolunk), nem? Ha ajánlottam három terméket (ajánlás tárolva), és megvett egyet (vásárlás tárolva), abból tudom, hogy melyik kettőt nem vette meg. Biztosan van olyan példa is, ami valóban a meg nem történt események tárolásáról szól, de nehéz ilyet elképzelni.

Teljesen igazad van, de régen a „mit ajánlottunk”-at nem tároltuk. Ki tudtunk indulni abból hogy mi volt vásárláskor készleten, mi volt a vásárlás pillanatában a vevő által megvásárolható termékek listáján, de nagyon nehezen tudtuk ezeket a kiszámolni. De ha ezt még meg is ugrottuk, akkor jött a következő kérdés, hogy mennyiért nem azt vásárolta meg. (Figyelemebe véve a saját árát, az éppen akkor futó akciókat, az akkor érvényes kondícióit) És ezt már ésszerű költségekkel nem tudtuk kimutatni. Vagy mondok egy másik példát. Egy webshopban tároltuk, hogy egy látogató mit vett, de azt nem, hogy mit keresett. Nem érte meg tárolni a kereséseket, mert a hagyományos technológiák drágák voltak hozzá. Vagy egy másik példa: tároltuk hogy mit vett, de nem tároltuk, hogy milyen ajánlatok közül választott, azok hol helyezkedtek el a weblapon, milyen áron látta őket volt. Mindig a Mit vett kérdésre koncentráltunk...

a webes látogatottsági elemzések. Azt már az "ősrégi", 15-20 éves rendszerek is tudták, hogy ki mire kattintott. De azt, hogy amikor rákattintott egy cikkre, akkor milyen más linkeket látott még, amire nem kattintott, azt nem.

Új hozzászólás