Analýza chování zákazníků a obchodních partnerů vůči společnosti Alpha Omega a jejich produktům
Analýza chování zákazníků a obchodních partnerů vůči společnosti Alpha Omega a jejich produktům
Veronika Babicová Petláková & Yuliia Lukach
Začneme asi nejlépe naším představením, ale nečekejte žádné osobní zpovědi, ale spíš bychom chtěly hned na začátku vysvětlit, proč jsme si zvolily data set společnosti Alpha Omega.
V našem společném medailonku jsme psaly, že jsme se začaly bavit na prvním setkání v rámci akademie a na dalším setkání bylo jasné, že my dvě můžeme starost s hledáním parťačky na projekt hodit za hlavu. A když přišla ta rozhodující chvíle a data sety nám byly představeny, náš výběr se shodně zúžil na pár témat. Finální volba vycházela nejen z možnosti pracovat s dvojící úžasných mentorů, ale také z povahy naší práce. Obě se totiž pohybujeme ve světě marketingu, i když každá se na tento proces díváme z trochu jiných úhlů, ale možnost vyzkoušet si něco nad reálnými obchodními daty a zároveň tuto zkušenost přenést do vlastní práce, byla pro nás prostě velmi lákavá. A že to byla dobrá volba, o tom Vás jistě přesvědčí náš blog.
Fáze - Jdeme na to
Už před hackathonem jsme měly hrubou představu o tom, jaká data budeme zpracovávat, a to díky poskytnutému vzorku, který sice zahrnoval pouze pár prvních řádků z každé tabulky, ale pomohlo nám to zorientovat se v jednotlivých sloupcích a načrtnout první verzi datového modelu. Velmi záhy jsme však zjistily, že dokud si data člověk prostě „neosahá“, tak o nich vlastně pořád nic neví.
První verze datového modelu vytvořené pomocí Draw.io
Fáze – Chápeš to?
Projekt byl založen na datech ze 7 tabulek, které zahrnovaly informace o zákaznících, partnerech, objednávkách a telemetrii. Data byla od roku 2012, což je období vývoje první generace produktu DLP (Data Loss Protection) – nástroje pro ochranu citlivých dat – hlavního produktu společnosti. Pro náš projekt jsme se po dohodě s mentorem, zaměřily na období od roku 2017, kdy bylo zaznamenáno významné rozšíření klientely i partnerské základny a s tím spojená expanze na nové trhy. Protože data zpracovávala kromě nás i další dvojice, rozdělily jsme si oblasti zájmu našich analýz. Našim hlavním cílem bylo prozkoumat chování zákazníků společnosti ve vztahu k nabízeným produktům, identifikovat slabá místa jednotlivých částí životního cyklu produktu a v neposlední řadě i analýza obchodních partnerů, kteří vstupují do prodejního procesu a svou činností mohou velmi ovlivnit výsledné rozhodnutí potenciálních či stávajících zákazníků.
Výzva č. 1 Čištění dat
Ač by se zdálo, že kromě běžných problémů s prázdnými řádky, špatným datovým formátem či chybějícími údaji nás nic tak hrozného nečeká, brzy jsme pochopily, že naším řešením asi nebude pouhé DELETE. Zároveň i čím více jsme začaly chápat souvislosti v obchodním procesu, kdy je zákazníkovi produkt představen formou cvičné verze a předáním zjištěných skutečností formou tzv. Proof of conceptu, až po realizaci objednávky či následného prodloužení doby jejího trvání, tak jsme objevovaly další nesrovnalosti v podobě vícečetných duplicit, odporujících si dat platností licencí či několikanásobných změn názvů jednotlivých produktů v průběhu času. Tyto „zvláštnosti“ však nakonec měly své odůvodnění a bylo nutné s nimi pracovat.
Ukázky vytvořených selektů
CO SE NÁM OSVĚDČILO
Z této fáze jsme si odnesly hned několik ponaučení pro další práci s daty:
· vždy si důkladně projít data, a to sloupec po sloupci;
· zkoušet různé typy propojení tabulek, hledat souvislosti;
· každý krok úprav (odstranění, opravy, duplicity či jiná zjištění) si zaznamenat, aby bylo možné daný krok kdykoli zopakovat (holt né vždy to vyjde napoprvé), ale také při analýze si ověřit, že už v této fázi jsme nedělaly nějakou chybu, která by mohla data zkreslit.
Fáze – Super, teď už nás čekají jen grafíky
Ta radost z načtení dat do Power BI se ani nedá popsat. Konečně, konečně se nám podařilo data vyčistit a už to půjde jako po másle. Ano, tohle byla asi naše první myšlenka, když jsme se dostaly to této fáze. Jasně, proč by to nešlo, když Adélka a další lektoři v Power BI prostě a jednoduše vytvářeli vizualizace na hodinách a opravdu to vypadalo jednoduše. Ale udělat dobrý vizuál prostě není jen tak. Takže metodou pokus-omyl jsme začaly vytvářet různé pohledy na stejných datech, až jsme našly ten správný vizuál, který by byl prostě úúúúúžasný.
Alpha Omega dobývá svět
Výzva č. 2 Vizualizace
Mapové vizuály nám pomohly hezky zpracovat expanzi společnosti, ale objevit i zajímavé anomálie. Například v souvislosti mezi zemí partnera a zemí zákazníků, většina partnerů se soustředila na země v dané oblasti, nikoli však partneři evropští. Ti mají zákazníky i v dosti vzdálených oblastech světa. Důvody takových kontrakcí, proč slovenský partner má zákazníka v Panamě nebo litevský v Bangladéši by byly čistě spekulativní, ale je zajímavé, že tento rozptyl vykazují pouze partneři z Evropy.
Ukázka pokrytí evropských partnerů
Některé vizuály však byly velmi těžko prezentovatelné s ohledem na anonymizaci poskytnutých dat. I s tím jsme si však nakonec poradily a vytvořily si jména vlastní. A nečekaně jsme si tak rovnou mohly ověřit i naše znalosti s prací v Pythonu a samozřejmě nám poradil i kamarád Google.
Program na vytváření fiktivních jmen a ukázka výstupu
Co nám však zabralo asi nejvíce času bylo hledání vhodných vizuálů, které by nejlépe zobrazily naše nápady. Hodně nás totiž zajímala časová souvislost či návaznost jednotlivých kroků v čase na což standardní vizuály nebyly moc vhodné. Zároveň jsme však zjistily, že nám nebudou stačit pouhé filtry nad vizuály nebo výpočty individuálních měr. Protože jsme velmi často pracovaly s určitým typem dat, tak jsme se raději vrátily zpět do MS SQL a vytvořily si nové tabulky kam jsme si vložily vybraná data, která jsme pro naše analýzy potřebovaly. Díky těmto úpravám pak bylo možné vykreslit návaznost jednotlivých období v životním cyklu produktu.
Ukázka časové dvou zákazníků od cvičné verze přes objednávku až po prodloužení
S časovou osou jsme si pak opravdu pohrály a připravily pro společnost Alpha Omega výstupy, které přehledně zobrazují, v jaké fázi se který zákazník nachází a zda by nebylo vhodné ho oslovit, například před koncem smlouvy. V tomto smyslu nás tedy zaujala možnost nastavení automatického reportu na e-mail, ale bohužel tato funkce je možná pouze v rozšířené verzi Power BI a nebylo možné si ji tedy vyzkoušet.
Ukázka aktuálního stavu objednávek u jednotlivých zákazníků
Naším záměrem bylo i vytváření clusterů pomocí nástroje Weka, ale bohužel z časových důvodů jsme se k tomuto bodu nedostaly.
CO SE NÁM OSVĚDČILO
I tady jsme narazily na další body, jak lépe pracovat s daty:
· někdy je lepší si vytvořit novou tabulku, než data neustále filtrovat nebo vytvářet specifické pohledy nad konkrétními vizuály;
· vytvořit si tabulku s kalendářem není úplně k zahození;
· online tutoriály na webu jsou k nezaplacení. 😄
Fáze – Holky budeme končit
Vizualizace a hledání zvláštností nás nakonec totálně pohltily, a tak jsme jen s velkým zklamáním zjistily, že nám nezbývá už moc dalšího času. To pozitivní však je, že máme stále spoustu nápadů, jaké vizuály by bylo možné připravit, a i když se nám to nepodaří realizovat v rámci digitální akademie, tak to určitě budeme chtít zvládnout na oficiální představení výsledků společnosti Alpha Omega, které bude probíhat formou prezentace.
Druhou dobrou zprávou je, že se nám povedlo najít odpovědi na většinu našich hypotéz, i když teď s lepší znalostí životního cyklu produktu nám připadá, že některé nedávají moc smysl a nyní bychom se zaměřily i jiným směrem. Ale i to je zjištění, které nám projekt přinesl.
Výzva: Nápady
S postupem času, kdy jsme stále víc chápaly souvislosti v datech napadaly nás i další možné parametry, které by bylo vhodné brát v úvahu, jako souvislosti s děním ve světě – zprávy týkající se hromadného úniku dat či hackerských útoků, ale třeba i pouhé porovnání vyhledávacích trendů s nástupem nových zákazníků. Na zkoušku jsme si například porovnávaly četnost vyhledávání názvů společností, které se oblastí ochrany citlivých dat zabývají. Podle výsledku samozřejmě není možné odvozovat žádné závěry, minimálně protože se jedná o různě velké firmy, které v některých případech nabízí mnohem více produktů z jiných oblastí, což určitě zkresluje výsledek, ale bylo by možná zajímavé podívat se na případné podobné trendy.
Zobrazení četností vyhledávání vybraných dotazů v období zavádění GDPR, zdroj: Google Trends.
Naše nápady se však netýkaly pouze analýz, ale i oblasti sběru zpracovávaných dat, protože v průběhu analýzy jsme narážely na nevyplněné parametry, které by bylo vhodné pro zlepšení důvěryhodnosti zpracovávaných analýz důrazněji požadovat při zadávání nových objednávek. Stejným problémem byla i omezená možnost zpracování zpětné vazby od zákazníků, která je v současné době pouze v textové podobě, což je tedy pro analýzu parametr téměř nezpracovatelný.
Fáze – Vážně už končíme? NEEEEEEE.
Digitální akademie nám dala opravdu úžasné možnosti seznámit se nejen s IT oblastí, ale až díky projektu si člověk mohl opravdu vyzkoušet, jestli vlastně pochopil, o co v datové analýze jde. Zároveň si mohl říct, jaká část z tohoto velmi komplexního systému ho vlastně zajímá a čemu by se tedy chtěl věnovat i v budoucnu. Ano, naše selekty použité v projektu určitě nejsou dokonalé a zkušený profesionál by možná vybral jiné vizuály, ale každý musí nějak začít.
A ta naše kariéra v IT je právě teď na startovní čáře.
Moc děkujeme za pomoc všem kolem. Nejen našim mentorům Lence Kmeťové a Miloši Minaříkovi, ale také našim blízkým, kteří to posledních pár týdnů museli doma táhnout za nás.
Já už se taky těším, až budu moct řešit takové analýzy a zlepšovat si tím zisk. Vím, že mám spoustu mezer a prostoru pro zlepšování, ale založení OSVČ pro mě není jednoduché a je toho najednou tolik, co je potřeba vyřešit a nevím co dřív. Nejdřív tak musím firmu rozjet, abych měla později co analyzovat.
OdpovědětVymazat