Dana Bajeneza: Analýza chování zákazníka na webových stránkách iLikeSharePoint
V závěrečném projektu IV. běhu digitální akademie lite Brno 2017 jsem
analyzovala data poskytnutá firmou iLikeSharePoint o chování jejich skutečných
i potencionálních klientů v časovém období 1. 9. 2015 – 1. 9. 2017. Data z
firemního účtu Google Analytics mi poskytla mentorka. Analýza je zaměřená na
vyhodnocení návštěvnosti stránek a segmentaci návštěvníků s grafickými výstupy
v Power BI k jednotlivým kritériím. Práce může být využita jako zpětná vazba
pro firmu za sledované období. Zároveň je možné použít úvod práce jako pomůcku při vytváření prvních grafů v Power BI.
Práce na projektu mi umožnila využít své dosavadní znalosti Excelu a hlavně
zdokonalit se a získat nové poznatky v prostředí Google Analytics. Výhodou bylo
seznámit se s vytvářením dashboardů v Power BI a možnostmi propojení dat GA, Excelu a Power BI. K aplikaci dat
poskytnutých mentorkou jsem musela nainstalovat Power BI desktop.
Orientace v uživatelském rozhraní GA byla pro mne, jako pro začínajícího uživatele, časově náročnější. GA
poskytuje mnoho možností vyhodnocení vlastních dat na základě volby dalších
dimenzí. Zaujala mne možnost exportu dat v několika formátech (PDF,
Tabulky Google, Excel (XLSX) a CSV). V mém projektu jsem použila
export dat do Excelu.
Následně jsem data v Excelu upravovala tak, aby bylo při různé volbě
dimenzí možné vytvořit vhodné grafy, tabulky a filtry v Power BI.
V některých případech bylo vhodnější, z pohledu navolení dimenzí
a metrik, exportovat data přímo z GA do souboru v Power BI pomocí Core
Reporting API.
Obr. č. 1
Všechny metriky a dimenze jsou rozděleny do několika sekcí. Možnost volby
mezi sekcemi je zřejmá z obr. č. 1. Metriky jsou označeny ikonoua dimenze .
. K vytvoření tabulky je nutné mít
vybranou nejméně jednu dimenzi a k ní metriku.
Ukázková tabulka dat mi byla vodítkem, jak postupovat při vytváření vlastních datasetů. Tabulka obsahovala
základní informace o sledovanosti
webových stránek.
Po sestavení vhodných datasetů jsem přistoupila k tvorbě grafů,
dashboardů. Z řady možných
typů grafů jsem se snažila vždy vybrat
ten, který byl názorný pro danou metriku.
Obr. č. 2
Grafy se snadno upraví vhodnou volbou filtru. Uživateli je tak dána možnost
vybrat hodnoty pro konkrétní proměnnou.
Po načtení dat z GA se uživateli zobrazí vlevo pod FIELDS stažený
soubor dat (tabulka). Kliknutím na ni se ukáží názvy jednotlivých kategorií
(sloupců). Zvolením proměnných, které chceme mít zobrazeny v grafu, se
začne v okně vytvářet graf. Pro tuto ukázku New/returning users jsem vybrala
koláčový graf (Pie charf). Další vzhled grafu lze dále upravovat pomocí pomůcek
pod Fields, Format nebo Analytics .
Ve Formátu najdete možnosti jak upravit samotný vzhled grafu nastavení os,
popisu hodnot v grafu, barvy proměnných atd. Pod Fields je v nabídce např.
filtr, kterým lze vymezit zobrazovanou
část dat.
Obr. č. 3
Chceme-li zobrazit tabulku, se kterou pracujeme, je v levé části
ikonka Data. Zvolíme načtenou tabulku,
kterou chceme zobrazit a můžeme ji případně upravit. Např. formát jak je
zapsáno datum přes Modeling.
Obr. č. 4
Pod ikonou Data je ikona
Relatinships. Zde můžeme sledovat relace mezi našimi datasety. Vzorové tabulky
spojuje kategorie User Type. Pro
výslednou vizualizaci to znamená provázanost grafů. Např. když v koláčovém
grafu označím část New users, pak se v pravém grafu zvýrazní New users v čase.
Obr. č. 5
Ve všech dashboardech jsem dodržovala firemní barvy. Úvodní
dashboard s logem iLikeSharePoint ukazuje četnost návštěv webových stránek,
zvlášt zobrazení homepage. Ke grafu je přiřazen slicer, takže je možná volba
jedné nebo více stránek s popisem
četnosti.
V kruhovém grafu je zobrazen podíl nových a vracejících se
uživatelů, hodnotou a procenty. Návštěvnost nových a vracejících se uživatelů lze sledovat v křivkovém grafu dole. Můžeme
navolit časový interval, který pozorovatele zajímá. V době konferencí, které probíhájí
v červnu a listopadu logicky dochází, jak vidíme k mnohem větší návštěvnosti
stránek.
Za zmínku také stojí “mrtvé” období v únoru 2017.
Konkrétně 5. 2. 2017 – 5. 3. 2017, kdy návštěvnost spadla na průměr jen 3
návštěvy denně. Co bylo příčinou tohoto poklesu sledovanosti stránek?
Neprojevuje se pokles sledovanosti např. i v souvislosti s termínem
jarních prázdnin?
Je zřejmé, že
největší sledovanost webu je ovlivněna přípravou konferencí, sledováním
průběhu konference a zpětnými vazbami po konferencích. Z tohoto důvodu navrhuji
konference rovnoměrně rozložit, každou do jednoho pololetí, např. květen,
listopad.
Obr. č. 6
Následující
dashboard zobrazuje demografické rozložení návštěvníků stránek – muž/žena a
věkové kategorie. V levé části je rozložení uživatelů do kategorií dle věku. V
pravé části je kruhový diagram zaměřený
na gender v procentech. Ženy tvoří
přibližnně 21% ze všech návštěv. Uprostřed je pak schéma vystihující propojení
obou předchozích kategorií.
Grafy jsou mezi
sebou interaktivní. Zvolíme-li např. vlevo věkovou kategorii 35 – 44, vidíme
celkový počet uživatelů, jejich
zastoupení v kategorii muž a žena v dané věkové kategorii a procentuální
vyjádření jejich části k mužům/ženám.
Tabulka
potvrzuje očekávaný poměr návštěvníků s převahou mladších věkových kategorií a
mužů. Malá čísla u kategorií 18 – 24, 55 – 64 a 64+ nás nemusí znepokojovat. Cílovou skupinou jsou lidé v produktivním věku, zaměstnanci větších
firem. Rozložení ve věkových kategoriích
25 – 34, 35 – 44, 45 – 54 by mělo
být rovnoměrnější. Přesněji
poslední zmíněná kategoriie by neměla
mít tak málo zástupců. Nabízí se
tedy otázka jak tuto část potenciálních
zákazníků oslovit?
Celkové
zastoupení žen je ve všech věkových kategoriích nízké. Je jejich zastoupení ve
větších firmách opravdu tak nepoměrné se zastoupením mužů nebo je důvod někde
jinde?
Řešením může být
bezplatná podpora, zaškolení, názornost využitelnosti pro jednotlivé oddělení
firem.
Obr. č. 7
Pro poskytovatele
stránek je zajímavé také geografické rozložení uživatelů k přípravě stránek s
možností volby jazyka. Na dashboardu je mapa, která může být pro názornost zobrazena při meetingu.
Další tabulka ukazuje základní údaje – název země a počet návštěv a uživatelů.
Opět je zde použit slicer a lze si vybrat buď zobrazení všech zemí nebo jen jednu, která je středem našeho zájmu. V současné době je dvojjazyčnost stránek považována za
běžnou. Podíváme – li se do tabulky na obsazení prvních čtyř pozic shledáme, že
možnost zobrazení stránky v angličtině je postačující. Možná by, ale
návštěvnost z Německa vzrostla přidáním ještě německého jazyka. Rozhodující
budou související náklady vzhledem k očekávanému nárustu návštěvnosti
(počet německých zákazníků).
Vlastní poznámka
při dvojjazyčnosti webu iLikeSharePoint – při volbě anglického jazyka “ENGLISH”
v záhlaví hlavní stránky se očekává po jejím odkliknutí změnu na “CZECH”. Daší,
co se mi vzhledově nelíbilo, stránky se
nepřeloží zcela. Potencionální zákazník
může být cizí firma sídlící v Česku a tuto nedokonalost bude vhodné odstranit.
Poskytovatel musí plánovitě
přizpůsobovat rozhraní stránek médiím, které lze s vývojem technických
prostředků očekávat u stávajících i
budoucích návštěvníků stránek. V následujícím dashboardu lze sledovat
využívanost rozhraní stránek a z ní odvodit prognózu pro nejbližší období.
Je vidět, že
uživatelé stránky navštěvují přibližně v 88% z počítače a jen
v 9% z mobilního telefonu a pouhá 2% se připojila z tabletu.
Přizpůsobování mobilním telefonům tedy nepovažuji za aktuální zlepšování
podmínek pro potencionální zákazníky.
Dashboard na
obr. č. 12 - 14 sleduje intenzitu návštěvnosti v jednotlivých dnech týdne
s vykreslením sledovanosti nových i vracejících se uživatelů. Zajímavé je
sledování návštěvnosti v jednotlivých dnech v průběhu zvoleného
časového intervalu 1. 9. 2015 – 1. 9. 2017, kde je zřetelná souvislost návštěvnosti stránek a
konferencemi, které se pravidelně konají
v červnu a listopadu.
Grafy
návštěvnosti v týdnech, rozřazení do kategorie nový/vracející se a křivka
návštěvnosti za sledované dva roky jsou mezi
sebou propojeny. Je tedy možné zvolit návštěvnost v úterý a uvidíme
kolik nových a vracejících zákazníků
navštívilo web a jak vypadá pro úterní návštevnost křivka trend line
(obr. č. 13).
Stejně tak
mohu navolit jen úterní nové návštěvy a výběr se vykreslí
i ve zbývajících dvou grafech (obr. č.
14).
Další, co můžeme sledovat je
Pagewievs a Unique Pageviews, což je jedinečné
zobrazení stránky představující souhrn zobrazení stránek vygenerovaných stejným
uživatelem během stejné relace.
Na obr. č. 15 je z grafu
zřetelná souvislost četnosti návštěv a hits. Při
vytváření statistik pro využívání webových stránek je relace uživatele někdy
označována jako návštěva. Znamená přítomnost uživatele s konkrétní IP adresou,
který nedávno navštívil web (obvykle kdykoli během posledních 30 minut). Počet
návštěv uživatelů za den je jedním z měřítek toho, kolik provozu má webový
server. Uživatel, který navštíví web v poledne a pak znovu v 16:30 hodin, se
počítá jako dvě návštěvy uživatelů. Hit pak odkazuje na počet souborů stažených
na webu, což může zahrnovat fotografie, grafiku apod.
Posledním grafem
je míra okamžitého opuštění stránek (Bourance rate) v procentech. Míra odchodu
znamená, že návštěvník opustil web ze vstupní
stránky bez interakce s další stránkou. Nemusí to být přímo ukazatel
nespokojenosti návštěvníka. Na stránce je umístěn opět slecer, kterým lze
sledovat užší časové období. Záměrně jsem vybrala období podzimní konference.
Návštěvnost roste, ale míra okamžitého odchodu se zdá být také vyšší. Je možné,
že účastníci nebo zájemci na homepage hledali např. jen kontakt, informaci o
konferenci, který ihned našli a web opustili.
Bourance rate –
míra okamžitého opuštění by tedy mohla být dál analyzována, přiřazením k dané
webové stránce. Například v odkazu na “kontakt” je v pořádku, že uživatel
stránku bez další akce opustí.
Obr. č. 15
Následující dashboardy se zaměřují na články zveřejňované
na webu iLikeSharePoint. Pro tyto
dashboardy jsem si vytvořila vlastní seznam o článcích (datum, autor, článek, sekce).
Ve firmě by mohla sloužit pro
porovnání, kdo, kdy, jaký článek napsal.
Kdo jich píše nejvíce, kdo již dlouho
nepublikoval.
Přes slicer je možno zvolit autora, který nás zajímá a podívat se
na jeho publikace (obr. č. 17). Dozvíme se, kolik publikací celkem za sledované
období napsal a kolik jich bylo v jednotlivých kategoriích.
Následuující
dashboard je rozřazením publikací a autorů pomocí časového intervalu.
Můžeme např. vybrat období 1. 10.
2015 – 4. 1. 2016 a zobrazí se seznam článků, které byly v tomto období publikovány.
Současně se nám vlevo zúží výběr autorů
a slicer nám již nabízí jen dva autory. Pokud bych tedy chtěla
z toho období znát přehled článků jednotlivého autora, zaškrtnu jej.
Dashboardy s články by mohly
pokračovat ještě napárováním jejich ohlasů na webu. Kolik lidí článek četlo,
kolik jej ohodnotilo kladně.
Výpisem autorů by např. šlo
kontrolovat, zda všichni autoři plní své
publikační povinnosti v zadaném období.
V grafu je možno sledovat u
jednotlivých autorů četnost publikací,
typ publikace (section) a datum publikování. Výhodné je grafické
vyjádření sledovanosti v souvislosti s uvedením článku.
ILikeSharePoint má samozřejmě I svůj profil na
facebooku. SharePoint byl původně určen pro
vnitrofiremní využití ve středně velkých firmách a velkých firemních odděleních
ve spolupráci s Microsoft Exchange, Skype pro firmy a Office webovými
aplikacemi.
Potencionálních zákazníků v ČR je odhadem okolo 300. Na Facebooku má
iLikeSharePoint v současné době 106 sledujících a návštěvnost FB, tak jako
návštěvnost webových stránek, je ovlivněna datem konání konferencí. Pro zvýšení
návštěvnosti a oslovení zbývajících potenciálních zákazníků by bylo vhodné
vytvořit i analýzu dat z FB.
Cíle projektu byly v rámci
DA s ohledem na časovou dotaci splněny. Jsem si vědoma, že je co zdokonalovat. Např. data by mohla být obohacena každodenní aktualizací a
dashboardy bude možné využít pro jakékoli zvolené období. Po skončení DA bych ráda
pokračovala v práci s Power BI a vytváření dashboardů.
Při zpracovávání projektu mě
nejvíce zaujalo množství nových informací o analýze webových stránek, hledání
souvislostí a vyvozování závěrů.
Závěrem děkuji mentorce Janě
Babáčkové za její trpělivost při vedení mé práce a za cenné rady.
Zdroje:
To je moc přínosné, díky. Hodně se teď o tohle téma zajímám, protože mám obchod, který se snažím co nejvíce dostat do povědomí lidi a tak jsem narazila i na seo analýzy. Tady jsem o tom četla hodně zajímavé info. A tohle mi přijde zase z druhé stránky, analyzovat chování koncového zákazníka. Obě varianty jsou velmi přínosné pro dobrý chod obchodu.
OdpovědětVymazatTak o tomto slyším poprvé, nicméně takové informace se určitě hodí. Sama teda eshop zatím nemám, ale ráda bych si brzy jeden rozjela. Problém je v tom, že tvroba eshopu je poměrně komplexní záležitost a je to něco, co sama určitě nezvládnu, takže bych minimálně potřebovala, aby mi s tím někdo pomohl.
OdpovědětVymazat