Sabina Křížová: Produktová analýza zahraničních trhů
Produktová analýza zahraničních trhů
Závěrečný projekt Digitální akademie v Brně
(květen až červenec 2017)
1. CÍL PROJEKTU
Srovnání cen 50 TOP produktů z vybraných
kategorií českého trhu se stejnými produkty na zahraničních trzích (Slovensko,
Maďarsko, Polsko, Rumunsko, Rakousko, Německo) na pozadí návštěvnosti e-shopů;
následná analýza a vizualizace dat.
2. POSTUP
VYTVOŘENÍ DATASETU
Soubor 50 TOP produktů z vybraných
kategorií CZ trhu.
Původní výběr kategorií byl rozšířen o
několik podkategorií (např. kytary akustické a kytary klasické, apod.). Práce
tak probíhala celkově s počtem 19 kategorií (tzn. 950 produktů).
ZDROJ:
ČIŠTĚNÍ DAT
Výstupem byl soubor v Excelu, kde
data pro každou kategorii se vyskytovala na samostatném listu. Bylo nutné
odstranit duplicitní hodnoty, vybrat relevantní sloupce a upravit text tak, aby
byl co nejvhodnější pro následné párování v zahraničních srovnávačích. Byla
použita funkce TRIM pro odstranění nadbytečných mezer v textu. Po úpravách
byl vytvořen nový soubor, který obsahoval pouze data potřebná pro další práci –
kategorii, název produktu, výrobce, zdroj dat (srovnávací web) a nejnižší cenu
v CZK.
POUŽITÍ APLIKACE AZOR MONITORING
Aplikace „AZOR“ (vlastní produkt firmy
TrendLucid) spárovala dané produkty s produkty na zahraničních trzích.
Použity byly tyto srovnávací weby:
Slovensko - heureka.sk
Maďarsko - arukereso.hu
Polsko - ceneo.pl
Rumunsko - compari.ro
Rakousko - idealo.at
Německo - idealo.de
Spárování nebylo dostačující, a tak jsem se rozhodli
(i přes očekávanou časovou náročnost) manuálně zkontrolovat všechny produkty na
zahraničních srovnávačích. Vložením patřičného URL do aplikace a její následnou
aktualizací bylo zajištěno správné spárování produktů. Výjimku tvořily
produkty, které se v zahraničí neprodávají.
Původně se spárovalo méně než 10 % produktů (z trhů
pouze SK a HU) a byla nutné asistence pracovníků firmy TrendLucid, aby se začaly
párovat i další trhy.
Následný výstup z aplikace „AZOR“ ve formátu
csv byl importován do Excelu. Pro kontrolu názvů spárovaných produktů jsme
použili tento vzorec:
=IF(ISNUMBER(SEARCH([@name];[@[name_1]]));"OK";":-(")
Přestože u většiny produktů byl zjištěn rozdíl
v názvu, šlo o drobné odchylky způsobené vlastní specifikací produktu
daným e-shopem a navíc díky předchozímu manuálnímu prověření jsme měli jistotu,
že dohledané produkty jsou v pořádku.
Do souboru jsme přidali nový sloupec, ve kterém
jsme přepočetli zahraniční měny na CZK.
ZAJIŠTĚNÍ VÝZNAMNÝCH E-SHOPŮ Z JEDNOTLIVÝCH TRHŮ
Abychom měli jistotu, že nám nechybí data z významných
e-shopů na daných trzích, rozhodli jsme se dohledat relevantní e-shopy na webu.
ZDROJ:
DOTAŽENÍ DAT O NÁVŠTĚVNOSTI E-SHOPŮ PŘES API
Použili jsme programovací jazyk Python v interaktivním
vývojovém prostředí SPYDER.
Ukázka použitého kódu:
import csv
import
requests
import json
import
pandas as pd
#otevření
CSV se seznamem domén na zkoušení a jejich přesun do listu, bude treba vzit
spravny soubor!!!
domeny=[]
'''with
open("output.csv","r")as csvfile:
spamreader = csv.reader(csvfile,
delimiter=' ', quotechar='|')
for row in spamreader:
domeny.append(', '.join(row))'''
#časové
rozmezí pro data...
... else:
vysledek =
parsed_json["data"][domena]["results"]
df =
pd.DataFrame.from_records(vysledek)
df["domena"] = domena
df.to_csv("mujVysledek.csv", sep=",",
encoding="utf-8", mode="a",header=False)...
Jako výstup jsme získali soubor ve formátu csv, ve kterém se nacházely údaje o návštěvnosti všech relevantních e-shopů.
PRÁCE V MICROSOFT POWER BI
Pro práci v Microsoft Power BI jsme použili
výstup z aplikace „AZOR“ („AZOR CZK“) a data o návštěvnosti e-shopů („Countries“).
Pro tvorbu datového modelu jsme dále vytvořili pomocné tabulky „Shopy“ a „Products“
a také potřebné souvztažnosti mezi tabulkami.
Do tabulky „AZOR CZK“ byl přidán podmíněný sloupec „COUNTRY“,
kam se dle zadaných podmínek doplnila země podle zdrojového srovnávacího webu.
Do tabulky „Products“ jsme přidali sloupec „AVG CZ
price“ pro výpočet průměrné ceny produktů z pěti nejlevnějších českých e-shopů.
Výpočet zajistil následující vzorec:
AVG CZ price =
AVERAGEX (
TOPN (
5;
FILTER ( RELATEDTABLE ( 'AZOR CZK' );
'AZOR CZK'[COUNTRY] = "CZ" );
'AZOR CZK'[Price with VAT CZK]; ASC
);
'AZOR CZK'[Price with VAT CZK]
)
Pro ostatní země byly rovněž vytvořeny sloupce a
přidány výpočty dle následujícího vzoru:
AVG HU price =
AVERAGEX(FILTER(RELATEDTABLE('AZOR CZK');'AZOR CZK'[COUNTRY] = "HU");
'AZOR CZK'[Price with VAT CZK])
Ještě jsme udělali výpočet rozdílů cen CZ trhu a
ostatních a dané výsledky jsme převedli na procentuální rozdíl. Aby nebyl
procentuální rozdíl zkreslen tím, že se produkty v některých zemích
neprodávají, bylo nutné upravit vzorec pro rozdíl tak, aby nezobrazoval výpočet
v případě, že nemáme k dispozici cenu daného produktu.
Diff CZ-HU =
IF(ISBLANK(Products[AVG HU price]); BLANK(); Products[AVG HU price] -
Products[AVG CZ price])
% CZ-HU = Products[Diff
CZ-HU] / Products[AVG CZ price]
V záložce „Modeling“ byly výpočty upraveny
tak, aby zobrazovaly Kč, a výpočet procentuálního rozdílu byl převeden na
procenta.
Data pro některé trhy (PL, RO, AT, DE) jsme měli k dispozici
později a bylo nutné vyřešit jejich jednoduché napojení do stávajícího Power
BI. Pro tento případ bylo vytvořeno fiktivní napojení na csv soubor „newtest“,
který zajistil pozdější bezproblémovou aktualizaci dat včetně vytvoření
potřebných sloupců, podmínek a výpočtů včetně převodu cen na CZK dle aktuálního
kurzovního lístku ČNB.
3. ZÁVĚREČNÁ ANALÝZA A VIZUALIZACE DAT
Po finální aktualizaci všech vstupů a vytvoření
potřebných sloupců a výpočtů jsme už mohli provádět potřebné analýzy dat a
jejich vizualizace.
*Kompletní verzi kódu pro dotažení návštěvnosti e-shopů,
konkrétní výsledky a podrobnou analýzu dat nelze veřejně publikovat.
**Děkuji za spolupráci na projektu Simoně K. a
pracovníkům firmy TrendLucid (Honza M., Honza K., Pavel K., Lucia M.).
Komentáře
Okomentovat