Markéta Lopraisová: RFM analýza objednávkových dat

RFM analýza objednávkových dat

Markéta Lopraisová



Úvodem
Ke kurzu DA i tématu projektu jsem přišla jako slepá k houslím. V oblasti analytiky, dat, kódování, marketingu jsem byla nepolíbená, a protože ráda zkouším nové věci, tak jsem do toho skočila po hlavě a stále se mi z toho motá.
S mentorem jsme se domluvili na RFM analýze objednávkových dat. Vlastní nápad jsem neměla, jen jsem věděla, že chci zpracovávat reálná data, něco praktického, užitečného. Bohužel nebo díkybohu? se jednalo o data anonymizovaná. Na jednu stranu mě mrzí, že absolutně netuším, s jakými daty, kterého e-shopu pracuji, na tu druhou mi odpadlo mnoho práce a stresu ohledně NDA, bezpečnosti a omezení se zveřejněním.
Zpátky k tématu a co se tedy skrývá pod RFM:
RFM spadá do zákaznické analytiky, což znamená, že se týká pouze lidí, kteří, už v našem e-shopu nakoupili. To nám ale nestačí, my potřebujeme, aby se klienti za námi vraceli. Nejsme e-shop co prodává rakve (ne, že bych jim nepřála stálé zákazníky…).
Taky nechceme nebo nemůžeme řešit zákazníky jednotlivě (personifikovaně) a proto si je pomocí RFM analýzy členíme do jednotlivých segmentů.
Recency – je první dimenze, říká nám, před jakou dobou si u nás daný zákazník objednal.
Frequency – znamená, kolikrát u nás zákazník nakoupil.
Monetary – kolik je celková nebo průměrná peněžní útrata daného klienta.
Každou dimenzi členíme do jednotlivých segmentů. Hodně zjednodušeně lze říci, že čím více zákazníků je v segmentech s vyšším číslem, tím lépe pro nás. Je-li recency 3, tak mi to říká, že je to nový nebo aktivní zákazník (což mi dále specifikuje frequency, monetary mi řekne, kolik utratil za objednávku), za to 1 mi značí jasnou “mrtvolu“, kterou klidně mohu pohřbít tunou newsletterů, protože nemám co ztratit.
Čím je kostka více členěná, tím více skupin zákazníků si vytvoříme. Je si potřeba ohlídat, aby mezi jednotlivými skupinami byly stále jisté charakteristické rozdíly. K hlídání toho bude víc a podrobnější informace k tomu najdete na  blogu Petra Šimečka:
Např: "POZOR! Zákaznická segmentace na základě RFM je sice jednoduchým nástrojem pro marketing, ale má taky svá úskalí. Nelze ji bezmyšlenkovitě uplatňovat na jakákoliv data, např. z celého e-shopu, který má velkou škálu heterogenních produktů. V takovém případě je nutné se zaměřit na jednotlivé sekce nebo oddělení a zamyslet se nad tím, než se vůbec vstupní data připraví."

A taky mohu doporučit video od Jana Tichého.
Moje “kostka” vyšla na 5x5x4 jak jde vidět na 3D modelu v PBI.




Na modelu můžeme různě nastavovat takové parametry, které nás zajímají.

Postup, techniky a nástroje
Co se týče práce, tak jsem v podstatě vycházela z jednoho základního datasetu zcela anonymních a randomizovaných dat, které mi mentor nachystal. Pak “dataset.csv“ stačilo nahrát do Power BI, poupravit nějaké drobnosti v DAXu a nastavit si správné datové typy, což se někdy ukázalo jako podlé, protože není číslo jako číslo. V průběhu přihodit nějaký ten sloupec se vzorcem podle toho co jsem potřebovala zjistit. Jo zní to snadně, pokud nemáte tendence dělat vše mnohem komplikovaněji, takové googlení a nalezené informace na community.powerbi.com mě jen sváděly na horší cestu. Viva stackoverflow.com!


No a tady máme zmiňovaný přehled prvního datasetu, pěkné a přehledné. No jasně, ale tohle nám nestačí, kde je to RFM? Takže na řadu přichází “eRko“ se kterým jsem se setkala na stáži ve firmě Medio Interactive. Byla to sranda, ale i zápřah. Tímto chci rozhodně poděkovat za příjemnou atmosféru, cenné informace, čas, který mi tam byl věnován a za dobrou kávu! Tak zpátky k projektu, od mentora jsem dostala skript a stáhla si již dostupnou knihovnu:


rfm<-read.csv("C:/users/malop/DA/projekt/dataset.csv")
rfm$revenue<- as.numeric(as.character(rfm$revenue))
rfm <- rfm[(rfm$revenue>0),]


rfm$date<-as.Date(as.character(rfm$date))
install.packages("devtools")
devtools::install_github("hoxo-m/easyRFM")


library(devtools)
library(easyRFM)


##############################################


result <- rfm_auto(rfm, id="customer", payment="revenue", date="date", tz = "UTC")
dataset<-result$get_sliced_rfm(R_slice=1:5, F_slice=1:5, M_slice=1:5)


a tady je k tomu i dokumentace https://github.com/hoxo-m/easyRFM
Uložíme si to jako csv, nahrajeme do Power BI, v DAXu vyladíme datové typy, další nutné drobnosti a propojíme s první tabulkou, primární a taky jediný klíč je customer a vznikne nám tento datový model.


Na řadu přichází vizualizace.
Vytvořila jsem celkem 7 interaktivních dashboardů. První 3 přehledně umožňují zobrazit informace vyplývající z hlavního datasetu, které se týkají zákazníků, objednávek, marží a tržeb. Další 4 se zaobírají RFM analýzou.
Tady se na to můžeme podívat a hrát si, což je více vypovídající než kupa obrázků.
Dalším krokem je interpretace dat a využití informací k vytvoření marketingové strategie, aby to bylo možné provést, tak je třeba data znát a rozumět jim.


Co mi projekt dal a vzal:
+ hrůzostrašné sny, ale taky nové zkušenosti a přátele, motivaci ke sportu (bohudík jsem projektu neutekla, vždy na mě čekal doma), dívat se na některé věci v souvislostech a klást si otázky, což považuji za jednu z klíčových schopností (stále je na čem pracovat)
- hodiny spánku, které se prokrastinací výrazně zkracovaly
Suma sumárum to stálo za to a bavilo mě to, věřím, že pro něco najdu uplatnění v práci.
Na závěr velké díky mému mentorovi, především za jeho trpělivost (pokud se nebude stydět, tak jméno dodatečně přidám).


Zdroje:

Komentáře

Populární příspěvky z tohoto blogu

Barbora Junová: Podpora začínajícího podnikání zaměřeného na prodej výrobků a poskytování služeb

Petra Havlínová: Automatické zpracování podkladů pro vyhodnocení vybraných KPI

Kateřina Kolouchová & Lenka Tomešová: Vliv počasí na kriminalitu v New Yorku a Brně