Sabina Křížová: Produktová analýza zahraničních trhů



Produktová analýza zahraničních trhů

Závěrečný projekt Digitální akademie v Brně (květen až červenec 2017)

1. CÍL PROJEKTU
Srovnání cen 50 TOP produktů z vybraných kategorií českého trhu se stejnými produkty na zahraničních trzích (Slovensko, Maďarsko, Polsko, Rumunsko, Rakousko, Německo) na pozadí návštěvnosti e-shopů; následná analýza a vizualizace dat.

2. POSTUP
VYTVOŘENÍ DATASETU
Soubor 50 TOP produktů z vybraných kategorií CZ trhu.
Původní výběr kategorií byl rozšířen o několik podkategorií (např. kytary akustické a kytary klasické, apod.). Práce tak probíhala celkově s počtem 19 kategorií (tzn. 950 produktů).
   ZDROJ:
 

ČIŠTĚNÍ DAT
Výstupem byl soubor v Excelu, kde data pro každou kategorii se vyskytovala na samostatném listu. Bylo nutné odstranit duplicitní hodnoty, vybrat relevantní sloupce a upravit text tak, aby byl co nejvhodnější pro následné párování v zahraničních srovnávačích. Byla použita funkce TRIM pro odstranění nadbytečných mezer v textu. Po úpravách byl vytvořen nový soubor, který obsahoval pouze data potřebná pro další práci – kategorii, název produktu, výrobce, zdroj dat (srovnávací web) a nejnižší cenu v CZK.

POUŽITÍ APLIKACE AZOR MONITORING
Aplikace „AZOR“ (vlastní produkt firmy TrendLucid) spárovala dané produkty s produkty na zahraničních trzích.
Použity byly tyto srovnávací weby:
   Slovensko - heureka.sk
   Maďarsko - arukereso.hu
   Polsko - ceneo.pl
   Rumunsko - compari.ro
   Rakousko - idealo.at
   Německo - idealo.de

Spárování nebylo dostačující, a tak jsem se rozhodli (i přes očekávanou časovou náročnost) manuálně zkontrolovat všechny produkty na zahraničních srovnávačích. Vložením patřičného URL do aplikace a její následnou aktualizací bylo zajištěno správné spárování produktů. Výjimku tvořily produkty, které se v zahraničí neprodávají.

Původně se spárovalo méně než 10 % produktů (z trhů pouze SK a HU) a byla nutné asistence pracovníků firmy TrendLucid, aby se začaly párovat i další trhy.


Následný výstup z aplikace „AZOR“ ve formátu csv byl importován do Excelu. Pro kontrolu názvů spárovaných produktů jsme použili tento vzorec:

=IF(ISNUMBER(SEARCH([@name];[@[name_1]]));"OK";":-(")

Přestože u většiny produktů byl zjištěn rozdíl v názvu, šlo o drobné odchylky způsobené vlastní specifikací produktu daným e-shopem a navíc díky předchozímu manuálnímu prověření jsme měli jistotu, že dohledané produkty jsou v pořádku.
Do souboru jsme přidali nový sloupec, ve kterém jsme přepočetli zahraniční měny na CZK.

ZAJIŠTĚNÍ VÝZNAMNÝCH E-SHOPŮ Z JEDNOTLIVÝCH TRHŮ
Abychom měli jistotu, že nám nechybí data z významných e-shopů na daných trzích, rozhodli jsme se dohledat relevantní e-shopy na webu.
  ZDROJ:

DOTAŽENÍ DAT O NÁVŠTĚVNOSTI E-SHOPŮ PŘES API
Použili jsme programovací jazyk Python v interaktivním vývojovém prostředí SPYDER.
Ukázka použitého kódu:
import csv
import requests
import json
import pandas as pd

#otevření CSV se seznamem domén na zkoušení a jejich přesun do listu, bude treba vzit spravny soubor!!!
domeny=[]
'''with open("output.csv","r")as csvfile:
    spamreader = csv.reader(csvfile, delimiter=' ', quotechar='|')
    for row in spamreader:
        domeny.append(', '.join(row))'''


#časové rozmezí pro data...

... else:
            vysledek = parsed_json["data"][domena]["results"]

            df = pd.DataFrame.from_records(vysledek)
            df["domena"] = domena
            df.to_csv("mujVysledek.csv", sep=",", encoding="utf-8", mode="a",header=False)...

Jako výstup jsme získali soubor ve formátu csv, ve kterém se nacházely údaje o návštěvnosti všech relevantních e-shopů.

PRÁCE V MICROSOFT POWER BI
Pro práci v Microsoft Power BI jsme použili výstup z aplikace „AZOR“ („AZOR CZK“) a data o návštěvnosti e-shopů („Countries“). Pro tvorbu datového modelu jsme dále vytvořili pomocné tabulky „Shopy“ a „Products“ a také potřebné souvztažnosti mezi tabulkami.


Do tabulky „AZOR CZK“ byl přidán podmíněný sloupec „COUNTRY“, kam se dle zadaných podmínek doplnila země podle zdrojového srovnávacího webu.


Do tabulky „Products“ jsme přidali sloupec „AVG CZ price“ pro výpočet průměrné ceny produktů z pěti nejlevnějších českých e-shopů. Výpočet zajistil následující vzorec:
AVG CZ price =
AVERAGEX (
    TOPN (
        5;
        FILTER ( RELATEDTABLE ( 'AZOR CZK' ); 'AZOR CZK'[COUNTRY] = "CZ" );
        'AZOR CZK'[Price with VAT CZK]; ASC
    );
    'AZOR CZK'[Price with VAT CZK]
)
Pro ostatní země byly rovněž vytvořeny sloupce a přidány výpočty dle následujícího vzoru:
AVG HU price = AVERAGEX(FILTER(RELATEDTABLE('AZOR CZK');'AZOR CZK'[COUNTRY] = "HU"); 'AZOR CZK'[Price with VAT CZK])
Ještě jsme udělali výpočet rozdílů cen CZ trhu a ostatních a dané výsledky jsme převedli na procentuální rozdíl. Aby nebyl procentuální rozdíl zkreslen tím, že se produkty v některých zemích neprodávají, bylo nutné upravit vzorec pro rozdíl tak, aby nezobrazoval výpočet v případě, že nemáme k dispozici cenu daného produktu.
Diff CZ-HU = IF(ISBLANK(Products[AVG HU price]); BLANK(); Products[AVG HU price] - Products[AVG CZ price])

% CZ-HU = Products[Diff CZ-HU] / Products[AVG CZ price]
V záložce „Modeling“ byly výpočty upraveny tak, aby zobrazovaly Kč, a výpočet procentuálního rozdílu byl převeden na procenta.

Data pro některé trhy (PL, RO, AT, DE) jsme měli k dispozici později a bylo nutné vyřešit jejich jednoduché napojení do stávajícího Power BI. Pro tento případ bylo vytvořeno fiktivní napojení na csv soubor „newtest“, který zajistil pozdější bezproblémovou aktualizaci dat včetně vytvoření potřebných sloupců, podmínek a výpočtů včetně převodu cen na CZK dle aktuálního kurzovního lístku ČNB.





3. ZÁVĚREČNÁ ANALÝZA A VIZUALIZACE DAT
Po finální aktualizaci všech vstupů a vytvoření potřebných sloupců a výpočtů jsme už mohli provádět potřebné analýzy dat a jejich vizualizace.




*Kompletní verzi kódu pro dotažení návštěvnosti e-shopů, konkrétní výsledky a podrobnou analýzu dat nelze veřejně publikovat.
**Děkuji za spolupráci na projektu Simoně K. a pracovníkům firmy TrendLucid (Honza M., Honza K., Pavel K., Lucia M.).

Komentáře

Populární příspěvky z tohoto blogu

Barbora Junová: Podpora začínajícího podnikání zaměřeného na prodej výrobků a poskytování služeb

Gabriela Kubová, Lucie Čuprová: Analýza ruských e-shopů pomocí srovnávače cen Yandex

Kateřina Kolouchová & Lenka Tomešová: Vliv počasí na kriminalitu v New Yorku a Brně