Simona Křížová: Analýza zahraničných trhov v oblasti e-commerce
Cieľom tohto projektu bola analýza vybraných zahraničných
trhov - Nemecko, Rakúsko, Slovensko, Poľsko, Maďarsko, Rumunsko komparativne s Českou republikou - informácie o trhu a konkurenci.
1. VYTVORENIE DATASETU
TOP 50
produktov z vybraných pod kategórií CZ trhu v Excel súbore.
2. ČISTENIE
DÁT
Dataset obsahoval viacero hárkov – pre každú pod kategóriu jeden. Bola prevedená úprava textu u jednotlivých produktov, odstránenie
nadbytočných prívlaskov, úprava dvojazyčných názvov, odstránenie duplicit,
vybrané stlpce s pre nás relevantnými hodnotami a údajmi. Vo
výsledku bol vytvorený nový súbor so zjednotenými relevantnými dátami v jednotnom
stlpci - kategórie, meno produktu, výrobca, odkaz na zdroj – heuréku.cz a
najlacnejšia cena v CZK.
3. AZOR MONITORING
AZOR je vlastný
produkt spoločnosti Datawebs (TrendLucid), ktorý funguje v prehliadači na
ich servery. VYBRANÉ ZAHRANIČNÉ TRHY A
ICH ZROVNÁVACIE WEBY: Slovensko - heureka.sk, Maďarsko - arukereso.hu, Poľsko -
ceneo.pl, Rumunsko - compari.ro, Rakúsko - idealo.at, Nemecko - idealo.de
Následovala
kontrola správnosti napárovania produktov. Z 942 produktov sa nám ich
v prvej fáze napárovalo iba 84. Za pomoci Honzu K. pracujúceho
v spoločnosti TrendLucid sa postupne spustili ďalšie vyhľadávače
a jednotlivé polia sa začali zafarbovať - u každého produktu je ikona daného portálu, tá by mala byť po úspešnom
napárovaní sfarbená. Pokiaľ je i naďalej sivá, tak nedošlo k spárovaniu, alebo
sa produkt na danom trhu nepredáva. Ako ďalší postup sme zvolili manuálnu
kontrolu, ktorá bola časovo náročná, ale zaistila nám relevantnosť získaných
dát.
Výstupný dataset z AZOR monitoring vo formáte csv bol prepracovaný na excel
tabulku do ktorej bol ešte pridaný stlpec so vzorcom pre overenie, či sa
spárované produkty z jednotlivých trhov nelíšia v názve =IF(ISNUMBER(SEARCH([@name];[@[name_1]]));"OK";":-(")
Vo výsleku sme zistili, že pre podobný
dataset, kde nie su Part Number je podobná filtrácia nerelevantná, pretože sa názvy
veľmi často líšia v drobnostiach. Vzhľadom k predchádzajúcej
manuálnej kontrole sme však mali istotu, že naše dáta sú v poriadku.
Ďalej sme od najväčších predajcov v zahraničí a CZ trhu vzali priemerné
ceny spárovaných produktov. V datasete bol vytvorený ďalší nový stlpec v
ktorom sa zahraničná mena prepočítala na CZK podľa aktuálneho kurzového lístku
ČNB. To nám umožní následné porovnanie podľa priemerných cien českých produktov na zahraničných trhoch a
vyselektovať, ktoré produkty v zahraničí chýbajú.
4. VALIDÁCIA VÝZNAMNÝCH E-SHOPOV NA JEDNOTLIVÝCH TRHOCH
Bolo potrebné zvalidovať, či nám nechýbajú údaje o významných eshopoch
pôsobiacich na daných trhoch, avšak nepôsobiacich na portáloch vyhľadávajúcih
tovar. Bolo treba zistiť similar sites a zistené údaje pridať do datasetu.
ZDROJ: https://www.similarweb.com
5. DÁTA O NÁVŠTEVNOSTI
JEDNOTLIVÝCH E-SHOPOV
Pre prácu s dátami z API bol použitý
programovací jazyk Python v interaktívnom vývojovom prostredí SPYDER. Vo výstupe (format csv) sa nachádzal zoznam všetkých relevantných eshopov v
daných segmentoch v zahraničí a ich priemerná mesačná návštevnosť. Tieto
údaje následne srovnáme s návštevnosťou lídrov na českom trhu.
*Bližie
informácie o API nie je možné publikovať.
KRÁTKY NÁHLED NA ČÁSTI KÓDU (* celý kód není určený k publikovaniu):
import csv
import requests
import json
import pandas as pd
#otevření CSV se seznamem domén na zkoušení a jejich
přesun do listu, bude treba vzit spravny soubor!!!
domeny=[]
'''with open("output.csv","r")as
csvfile:
spamreader =
csv.reader(csvfile, delimiter=' ', quotechar='|')
for row in
spamreader:
domeny.append(', '.join(row))'''
#časové rozmezí pro data...
... else:
vysledek = parsed_json["data"][domena]["results"]
df =
pd.DataFrame.from_records(vysledek)
df["domena"] = domena
df.to_csv("mujVysledek.csv", sep=",",
encoding="utf-8", mode="a",header=False)...
6. POUŽITIE MICROSOFT POWER BI
Pre vytvorenie datového
modelu, analýzu dát a ich vizualizáciu sme si zvolili nástroj Microsoft Power
BI. Vo výstupnom datasete z AZOR monitoring sme pre potrebu identifikácie
jednotlivých trhov vytvorili podmienený stlpec „COUNTRY“. Pri tvorbe datového modelu boli vytvorené samostatné tabulky
„Shop“ a „Products“. Do tabulky
„Products“ boli pridané stlpce pre výpočet priemerných zahraničných cien prevedených
na CZK:
AVG HU price = AVERAGEX(FILTER(RELATEDTABLE('AZOR CZK');'AZOR
CZK'[COUNTRY] = "HU"); 'AZOR CZK'[Price with VAT CZK])
Ďalej boli vytvorené stlpce pre výpočet
rozdielu cien CZ i dalších krajín, a ich prevod na percentuálny rozdiel. Aby nedošlo
k skresleniu percentuálneho rozdielu kvôli tomu, že sa nejaký produkt
v niektorej krajine nepredáva, bol vzorec pre výpočet rozdielu cien upravený
následovne:
Diff CZ-HU = IF(ISBLANK(Products[AVG HU price]); BLANK();
Products[AVG HU price] - Products[AVG CZ price]) % CZ-HU = Products[Diff CZ-HU]
/ Products[AVG CZ price]
Nad takto pripravenými dátami už bolo možné urobiť
samotnú analýzu a dáta následne vizualizovat.
*Výsledky analýzy nie su určené
pre publikovanie.
Komentáře
Okomentovat