Meg nem történt események tárolása


Ha kinyitjuk bármelyik nagy adattárház guru könyvét, akkor rögtön a könyv elején elolvashatjuk, hogy a meg nem történt eseményeket nem tároljuk. Nem tároljuk például azt, hogy szombaton nem vásárolt senki. Csak azt tároljuk, ha valaki vásárolt. Olyan axiómája volt ez az adattárház építési módszertanoknak, amelyeket előszeretettel alkalmaztunk.

A Big Data technológiák megjelenése azonban teljesen felrúgta ezt az axiómát és lehetővé tette, hogy a meg nem történt eseményeket is tároljuk. Tény, hogy az elemzőket továbbra is az érdekli elsősorban, hogy ki mit vásárolt (Mit adtunk el?), de ha erre a kérdésre megkapják a választ, akkor jön a következő kérdés: Ki mit nem vásárolt? (Miért nem vásárolt?).

Gondoljon például egy ajánlórendszerre ahol legalább annyira fontos az, hogy az ajánlatok közül mit választott az ügyfél, mint az hogy mit nem. Vagy gondoljon például egy vállalat webes értékesítési rendszerére, ahol az ügyfél rákeres egy konkrét termékre vagy szolgáltatásra, de aztán nem vásárol semmit. Miért nem vásárolt? Milyen termékeket látott az első oldalon? Milyen áron látta a termékeket? Milyen sorrendben jelentek meg neki a termékek?

Mind-mind olyan kérdés, amelyet nem lehet megválaszolni anélkül hogy ne tárolnánk a mit nem vett eseményeket...

Amikor a Big Data használati lehetőségeit keressük egy „hagyományos” nagyvállalatnál, akkor pont az ilyen új területek lehetnek érdekesek. A ki mit vásárolt kérdésre megkapjuk a választ régóta a hagyományos technológiákkal, nincs értelme Big Datában gondolkodni. De a ki mit nem vásárolt kérdés megválaszolására még új terület. Nincsenek róla adataink és a hagyományos technológiákkal valószínűleg csak nagyon drágán tudnánk gyűjteni, tárolni azokat.

Ha nyitni akar a vállalatánál a Big Data felé, akkor elsősorban az ilyen kiaknázatlan területeket keresse. Olyan logok, adatok után kutasson, amelyeket eddig nem tároltak, vagy nem tároltak 15 másodpercnél tovább, de lehet üzleti hasznuk. Ezek tárolása, majd későbbi elemzése hozhatja meg a várt sikert.

Kővári Attila
2016. március 02.
Címkék:

3 Hozzászólás

Meg nem történt események

Nekem ez nem annyira jött át. A mit nem vásárolt kérdésre tudunk azzal válaszolni, hogy a teljes halmazból (amit tárolunk) kivonjuk a vásárlás halmazát (amit szintén tárolunk), nem? Ha ajánlottam három terméket (ajánlás tárolva), és megvett egyet (vásárlás tárolva), abból tudom, hogy melyik kettőt nem vette meg. Biztosan van olyan példa is, ami valóban a meg nem történt események tárolásáról szól, de nehéz ilyet elképzelni.

Teljesen igazad van, de

Teljesen igazad van, de régen a „mit ajánlottunk”-at nem tároltuk. Ki tudtunk indulni abból hogy mi volt vásárláskor készleten, mi volt a vásárlás pillanatában a vevő által megvásárolható termékek listáján, de nagyon nehezen tudtuk ezeket a kiszámolni. De ha ezt még meg is ugrottuk, akkor jött a következő kérdés, hogy mennyiért nem azt vásárolta meg. (Figyelemebe véve a saját árát, az éppen akkor futó akciókat, az akkor érvényes kondícióit) És ezt már ésszerű költségekkel nem tudtuk kimutatni.

Vagy mondok egy másik példát. Egy webshopban tároltuk, hogy egy látogató mit vett, de azt nem, hogy mit keresett. Nem érte meg tárolni a kereséseket, mert a hagyományos technológiák drágák voltak hozzá. Vagy egy másik példa: tároltuk hogy mit vett, de nem tároltuk, hogy milyen ajánlatok közül választott, azok hol helyezkedtek el a weblapon, milyen áron látta őket volt. Mindig a Mit vett kérdésre koncentráltunk...

Egy másik példa erre

a webes látogatottsági elemzések. Azt már az "ősrégi", 15-20 éves rendszerek is tudták, hogy ki mire kattintott. De azt, hogy amikor rákattintott egy cikkre, akkor milyen más linkeket látott még, amire nem kattintott, azt nem.

Szóljon hozzá!

Szabály: Legyen kedves, segítõkész és vállalja a nevét.
A mező tartalma nem nyilvános.
  • A web és email címek automatikusan linkekké alakulnak.
  • Engedélyezett HTML elemek: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • A sorokat és bekezdéseket automatikusan felismeri a rendszer.
ANTI SPAM
A robot regisztrációk elkerülésére.
Image CAPTCHA
Figyeljen a kis és nagybetűk használatára