Dana Bajeneza: Analýza chování zákazníka na webových stránkách iLikeSharePoint

                                                                                     
V závěrečném projektu IV. běhu digitální akademie lite Brno 2017 jsem analyzovala data poskytnutá firmou iLikeSharePoint o chování jejich skutečných i potencionálních klientů v časovém období 1. 9. 2015 – 1. 9. 2017. Data z firemního účtu Google Analytics mi poskytla mentorka. Analýza je zaměřená na vyhodnocení návštěvnosti stránek a segmentaci návštěvníků s grafickými výstupy v Power BI k jednotlivým kritériím. Práce může být využita jako zpětná vazba pro firmu za sledované období. Zároveň je možné použít úvod práce jako pomůcku při vytváření prvních grafů v Power BI.

Práce na projektu mi umožnila využít své dosavadní znalosti Excelu a hlavně zdokonalit se a získat nové poznatky v prostředí Google Analytics. Výhodou bylo seznámit se s vytvářením dashboardů v Power BI a možnostmi propojení  dat GA, Excelu a Power BI. K aplikaci dat poskytnutých mentorkou jsem musela nainstalovat Power BI desktop.
Orientace v uživatelském rozhraní GA byla pro mne, jako pro  začínajícího uživatele, časově náročnější. GA poskytuje mnoho možností vyhodnocení vlastních dat na základě volby dalších dimenzí. Zaujala mne možnost exportu dat v několika formátech (PDF, Tabulky Google, Excel (XLSX) a CSV). V mém projektu jsem použila export  dat do  Excelu.

Následně jsem data v Excelu upravovala tak, aby bylo při různé volbě dimenzí možné vytvořit vhodné grafy, tabulky a filtry v Power BI.
V některých případech bylo vhodnější, z pohledu navolení dimenzí a metrik, exportovat data přímo z GA do souboru v Power BI pomocí Core Reporting API.


 Obr. č. 1

Všechny metriky a dimenze jsou rozděleny do několika sekcí. Možnost volby mezi sekcemi je zřejmá z obr. č. 1. Metriky jsou označeny ikonoua dimenze .
 
.   K vytvoření tabulky je nutné mít vybranou nejméně jednu dimenzi a k ní metriku.


Ukázková tabulka dat mi byla vodítkem, jak postupovat při vytváření  vlastních datasetů. Tabulka obsahovala základní informace o  sledovanosti webových stránek.
Po sestavení vhodných datasetů jsem přistoupila k tvorbě grafů, dashboardů. Z řady  možných typů  grafů jsem se snažila vždy vybrat ten, který byl názorný pro danou metriku.

Obr. č. 2

Grafy se snadno upraví vhodnou volbou filtru. Uživateli je tak dána možnost vybrat hodnoty pro konkrétní proměnnou.

Po načtení dat z GA se uživateli zobrazí vlevo pod FIELDS stažený soubor dat (tabulka). Kliknutím na ni se ukáží názvy jednotlivých kategorií (sloupců). Zvolením proměnných, které chceme mít zobrazeny v grafu, se začne v okně vytvářet graf. Pro tuto ukázku New/returning users jsem vybrala koláčový graf (Pie charf). Další vzhled grafu lze dále upravovat pomocí pomůcek pod Fields, Format nebo Analytics .

Ve Formátu najdete možnosti jak upravit samotný vzhled grafu nastavení os, popisu hodnot v grafu, barvy proměnných atd. Pod Fields je v nabídce např. filtr, kterým  lze vymezit zobrazovanou část dat.

Obr. č. 3

Chceme-li zobrazit tabulku, se kterou pracujeme, je v levé části ikonka Data. Zvolíme  načtenou tabulku, kterou chceme zobrazit a můžeme ji případně upravit. Např. formát jak je zapsáno datum přes Modeling.

Obr. č. 4

Pod ikonou Data je ikona Relatinships. Zde můžeme sledovat relace mezi našimi datasety. Vzorové tabulky spojuje kategorie User Type.  Pro výslednou vizualizaci to znamená provázanost grafů. Např. když v koláčovém grafu označím část New users, pak se v pravém grafu zvýrazní New users v čase.


Obr. č. 5

Ve všech dashboardech jsem dodržovala firemní barvy. Úvodní dashboard s logem iLikeSharePoint ukazuje četnost návštěv webových stránek, zvlášt zobrazení homepage. Ke grafu je přiřazen slicer, takže je možná volba jedné nebo více stránek s popisem  četnosti.
V kruhovém grafu je zobrazen podíl nových a vracejících se uživatelů, hodnotou a procenty. Návštěvnost nových a vracejících se uživatelů  lze sledovat v křivkovém grafu dole. Můžeme navolit časový interval, který pozorovatele zajímá. V době konferencí, které probíhájí v červnu a listopadu logicky dochází, jak vidíme k mnohem větší návštěvnosti stránek.
Za zmínku také stojí “mrtvé” období v únoru 2017. Konkrétně 5. 2. 2017 – 5. 3. 2017, kdy návštěvnost spadla na průměr jen 3 návštěvy denně. Co bylo příčinou tohoto poklesu sledovanosti stránek? Neprojevuje se pokles sledovanosti např. i v souvislosti s termínem jarních prázdnin?
Je zřejmé, že  největší sledovanost webu je ovlivněna přípravou konferencí, sledováním průběhu konference a zpětnými vazbami po konferencích. Z tohoto důvodu navrhuji konference rovnoměrně rozložit, každou do jednoho pololetí, např. květen, listopad.

Obr. č. 6

Následující dashboard zobrazuje demografické rozložení návštěvníků stránek – muž/žena a věkové kategorie. V levé části je rozložení uživatelů do kategorií dle věku. V pravé části  je kruhový diagram zaměřený na gender  v procentech. Ženy tvoří přibližnně 21% ze všech návštěv. Uprostřed je pak schéma vystihující propojení obou předchozích kategorií.
Grafy jsou mezi sebou interaktivní. Zvolíme-li např. vlevo věkovou kategorii 35 – 44, vidíme celkový počet  uživatelů, jejich zastoupení v kategorii muž a žena v dané věkové kategorii a procentuální vyjádření jejich části k mužům/ženám.
Tabulka potvrzuje očekávaný poměr návštěvníků s převahou mladších věkových kategorií a mužů. Malá čísla u kategorií 18 – 24, 55 – 64 a 64+ nás nemusí  znepokojovat. Cílovou skupinou jsou lidé  v produktivním věku, zaměstnanci větších firem. Rozložení ve věkových kategoriích  25 – 34, 35 – 44, 45 – 54 by mělo  být  rovnoměrnější. Přesněji poslední  zmíněná kategoriie by neměla mít tak málo zástupců. Nabízí  se tedy  otázka jak tuto část potenciálních zákazníků oslovit?
Celkové zastoupení žen je ve všech věkových kategoriích nízké. Je jejich zastoupení ve větších firmách opravdu tak nepoměrné se zastoupením mužů nebo je důvod někde jinde?
Řešením může být bezplatná podpora, zaškolení, názornost využitelnosti pro jednotlivé oddělení firem.

Obr. č. 7


Obr. č. 8

Pro poskytovatele stránek je zajímavé také geografické rozložení uživatelů k přípravě stránek s možností volby jazyka. Na dashboardu je mapa, která může  být pro názornost zobrazena při meetingu. Další tabulka ukazuje základní údaje – název země a počet návštěv a uživatelů. Opět je zde  použit slicer a lze si  vybrat buď zobrazení  všech zemí nebo jen jednu, která  je středem našeho zájmu. V současné  době je dvojjazyčnost stránek považována za běžnou. Podíváme – li se do tabulky na obsazení prvních čtyř pozic shledáme, že možnost zobrazení stránky v angličtině je postačující. Možná by, ale návštěvnost z Německa vzrostla přidáním ještě německého jazyka. Rozhodující budou související náklady vzhledem k očekávanému nárustu návštěvnosti (počet německých zákazníků).
Vlastní poznámka při dvojjazyčnosti webu iLikeSharePoint – při volbě anglického jazyka “ENGLISH” v záhlaví hlavní stránky se očekává po jejím odkliknutí změnu na “CZECH”. Daší, co se mi  vzhledově nelíbilo, stránky se nepřeloží  zcela. Potencionální zákazník může být cizí firma sídlící v Česku a tuto nedokonalost bude vhodné odstranit.

Obr. č.  9


Obr. č.  10

Poskytovatel musí plánovitě přizpůsobovat rozhraní stránek médiím, které lze s vývojem technických prostředků očekávat  u stávajících i budoucích návštěvníků stránek. V následujícím dashboardu lze sledovat využívanost rozhraní stránek a z ní odvodit prognózu pro nejbližší období.
Je vidět,  že  uživatelé stránky navštěvují přibližně v 88% z počítače a jen v 9% z mobilního telefonu a pouhá 2% se připojila z tabletu. Přizpůsobování mobilním telefonům tedy nepovažuji za aktuální zlepšování podmínek pro potencionální zákazníky.

Obr. č. 11

Dashboard na obr. č. 12 - 14 sleduje intenzitu návštěvnosti v jednotlivých dnech týdne s vykreslením sledovanosti nových i vracejících se uživatelů. Zajímavé je sledování návštěvnosti v jednotlivých dnech v průběhu zvoleného časového intervalu 1. 9. 2015 – 1. 9. 2017, kde je zřetelná  souvislost návštěvnosti stránek a konferencemi, které  se pravidelně konají v červnu a listopadu.
Grafy návštěvnosti v týdnech, rozřazení do kategorie nový/vracející se a křivka návštěvnosti za sledované dva roky jsou mezi  sebou propojeny. Je tedy možné zvolit návštěvnost v úterý a uvidíme kolik nových a vracejících zákazníků  navštívilo web a jak vypadá pro úterní návštevnost křivka trend line (obr. č. 13).
Stejně tak mohu  navolit  jen úterní nové návštěvy a výběr se vykreslí i  ve zbývajících dvou grafech (obr. č. 14).

Obr. č.  12


Obr. č.  13


Obr. č.  14

Další, co můžeme sledovat je Pagewievs a Unique Pageviews, což je jedinečné zobrazení stránky představující souhrn zobrazení stránek vygenerovaných stejným uživatelem během stejné relace.
Na obr. č. 15 je z grafu zřetelná souvislost četnosti návštěv a hits. Při vytváření statistik pro využívání webových stránek je relace uživatele někdy označována jako návštěva. Znamená přítomnost uživatele s konkrétní IP adresou, který nedávno navštívil web (obvykle kdykoli během posledních 30 minut). Počet návštěv uživatelů za den je jedním z měřítek toho, kolik provozu má webový server. Uživatel, který navštíví web v poledne a pak znovu v 16:30 hodin, se počítá jako dvě návštěvy uživatelů. Hit pak odkazuje na počet souborů stažených na webu, což může zahrnovat fotografie, grafiku apod.
Posledním grafem je míra okamžitého opuštění stránek (Bourance rate) v procentech. Míra odchodu znamená,  že návštěvník opustil web ze vstupní stránky bez interakce s další stránkou. Nemusí to být přímo ukazatel nespokojenosti návštěvníka. Na stránce je umístěn opět slecer, kterým lze sledovat užší časové období. Záměrně jsem vybrala období podzimní konference. Návštěvnost roste, ale míra okamžitého odchodu se zdá být také vyšší. Je možné, že účastníci nebo zájemci na homepage hledali např. jen kontakt, informaci o konferenci, který ihned našli a web opustili.
Bourance rate – míra okamžitého opuštění by tedy mohla být dál analyzována, přiřazením k dané webové stránce. Například v odkazu na “kontakt” je v pořádku, že uživatel stránku bez další akce opustí.

Obr. č. 15

Následující  dashboardy se zaměřují na články zveřejňované na webu  iLikeSharePoint. Pro tyto dashboardy jsem si vytvořila vlastní seznam o článcích  (datum, autor, článek, sekce).
Ve firmě by mohla sloužit pro porovnání, kdo, kdy, jaký článek napsal.  Kdo jich píše nejvíce, kdo již dlouho  nepublikoval.

Obr. č. 16

Přes slicer je možno  zvolit autora, který nás zajímá a podívat se na jeho publikace (obr. č. 17). Dozvíme se, kolik publikací celkem za sledované období napsal a kolik jich bylo v jednotlivých kategoriích.

Obr. č. 17

Následuující dashboard je rozřazením publikací a autorů pomocí časového intervalu.

Obr. č. 18

Můžeme např. vybrat období 1. 10. 2015 – 4. 1. 2016 a zobrazí se seznam článků, které byly v tomto období publikovány. Současně se nám vlevo zúží výběr autorů  a slicer nám již nabízí jen dva autory. Pokud bych tedy chtěla z toho období znát přehled článků jednotlivého autora, zaškrtnu jej.
Dashboardy s články by mohly pokračovat ještě napárováním jejich ohlasů na webu. Kolik lidí článek četlo, kolik jej ohodnotilo kladně.
Výpisem autorů by např. šlo kontrolovat,  zda všichni autoři plní své publikační povinnosti v zadaném období.

Obr. č. 19

V grafu je možno sledovat u jednotlivých autorů četnost publikací,  typ publikace (section) a datum publikování. Výhodné je grafické vyjádření sledovanosti v souvislosti s uvedením článku.


ILikeSharePoint má samozřejmě I svůj profil na facebooku. SharePoint byl původně určen pro vnitrofiremní využití ve středně velkých firmách a velkých firemních odděleních ve spolupráci s Microsoft Exchange, Skype pro firmy a Office webovými aplikacemi. 
Potencionálních zákazníků v ČR je odhadem okolo 300. Na Facebooku má iLikeSharePoint v současné době 106 sledujících a návštěvnost FB, tak jako návštěvnost webových stránek, je ovlivněna datem konání konferencí. Pro zvýšení návštěvnosti a oslovení zbývajících potenciálních zákazníků by bylo vhodné vytvořit i analýzu dat z FB.


Cíle projektu byly v rámci DA s ohledem na časovou dotaci splněny. Jsem si vědoma, že je co  zdokonalovat. Např. data by mohla  být obohacena každodenní aktualizací a dashboardy bude možné využít pro jakékoli zvolené období. Po skončení DA bych ráda pokračovala v práci s Power BI a vytváření dashboardů.
Při zpracovávání projektu mě nejvíce zaujalo množství nových informací o analýze webových stránek, hledání souvislostí a vyvozování závěrů.
Závěrem děkuji mentorce Janě Babáčkové za její trpělivost při vedení mé práce a za cenné  rady.


Zdroje:






Komentáře

  1. To je moc přínosné, díky. Hodně se teď o tohle téma zajímám, protože mám obchod, který se snažím co nejvíce dostat do povědomí lidi a tak jsem narazila i na seo analýzy. Tady jsem o tom četla hodně zajímavé info. A tohle mi přijde zase z druhé stránky, analyzovat chování koncového zákazníka. Obě varianty jsou velmi přínosné pro dobrý chod obchodu.

    OdpovědětVymazat
  2. Tak o tomto slyším poprvé, nicméně takové informace se určitě hodí. Sama teda eshop zatím nemám, ale ráda bych si brzy jeden rozjela. Problém je v tom, že tvroba eshopu je poměrně komplexní záležitost a je to něco, co sama určitě nezvládnu, takže bych minimálně potřebovala, aby mi s tím někdo pomohl.

    OdpovědětVymazat

Okomentovat

Populární příspěvky z tohoto blogu

Barbora Junová: Podpora začínajícího podnikání zaměřeného na prodej výrobků a poskytování služeb

Gabriela Kubová, Lucie Čuprová: Analýza ruských e-shopů pomocí srovnávače cen Yandex

Kateřina Kolouchová & Lenka Tomešová: Vliv počasí na kriminalitu v New Yorku a Brně