Simona Křížová: Analýza zahraničných trhov v oblasti e-commerce


Cieľom tohto projektu bola analýza vybraných zahraničných trhov - Nemecko, Rakúsko, Slovensko, Poľsko, Maďarsko, Rumunsko komparativne s Českou republikou - informácie o trhu a konkurenci.

1. VYTVORENIE DATASETU

TOP 50 produktov z vybraných pod kategórií CZ trhu v Excel súbore.
















  

2.  ČISTENIE DÁT

Dataset obsahoval viacero hárkov – pre každú pod kategóriu jeden. Bola prevedená úprava textu u jednotlivých produktov, odstránenie nadbytočných prívlaskov, úprava dvojazyčných názvov, odstránenie duplicit, vybrané stlpce s pre nás relevantnými hodnotami a údajmi. Vo výsledku bol vytvorený nový súbor so zjednotenými relevantnými dátami v jednotnom stlpci - kategórie, meno produktu, výrobca, odkaz na zdroj – heuréku.cz a najlacnejšia cena v CZK.


3.  AZOR MONITORING

AZOR je vlastný produkt spoločnosti Datawebs (TrendLucid), ktorý funguje v prehliadači na ich servery. VYBRANÉ ZAHRANIČNÉ TRHY A ICH ZROVNÁVACIE WEBY: Slovensko - heureka.sk, Maďarsko - arukereso.hu, Poľsko - ceneo.pl, Rumunsko - compari.ro, Rakúsko - idealo.at, Nemecko - idealo.de

Následovala kontrola správnosti napárovania produktov. Z 942 produktov sa nám ich v prvej fáze napárovalo iba 84. Za pomoci Honzu K. pracujúceho v spoločnosti TrendLucid sa postupne spustili ďalšie vyhľadávače a jednotlivé polia sa začali zafarbovať - u každého produktu je ikona daného portálu, tá by mala byť po úspešnom napárovaní sfarbená. Pokiaľ je i naďalej sivá, tak nedošlo k spárovaniu, alebo sa produkt na danom trhu nepredáva. Ako ďalší postup sme zvolili manuálnu kontrolu, ktorá bola časovo náročná, ale zaistila nám relevantnosť získaných dát.


















Výstupný dataset z AZOR monitoring vo formáte csv bol prepracovaný na excel tabulku do ktorej bol ešte pridaný stlpec so vzorcom pre overenie, či sa spárované produkty z jednotlivých trhov nelíšia v názve =IF(ISNUMBER(SEARCH([@name];[@[name_1]]));"OK";":-(")

Vo výsleku sme zistili, že pre podobný dataset, kde nie su Part Number je podobná filtrácia nerelevantná, pretože sa názvy veľmi často líšia v drobnostiach. Vzhľadom k predchádzajúcej manuálnej kontrole sme však mali istotu, že naše dáta sú v poriadku.

Ďalej sme od najväčších predajcov v zahraničí a CZ trhu vzali priemerné ceny spárovaných produktov.  V datasete bol vytvorený ďalší nový stlpec v ktorom sa zahraničná mena prepočítala na CZK podľa aktuálneho kurzového lístku ČNB. To nám umožní následné porovnanie podľa priemerných cien českých produktov na zahraničných trhoch a vyselektovať, ktoré produkty v zahraničí chýbajú.

4. VALIDÁCIA VÝZNAMNÝCH E-SHOPOV NA JEDNOTLIVÝCH TRHOCH

Bolo potrebné zvalidovať, či nám nechýbajú údaje o významných eshopoch pôsobiacich na daných trhoch, avšak nepôsobiacich na portáloch vyhľadávajúcih tovar. Bolo treba zistiť similar sites a zistené údaje pridať do datasetu. 

5. DÁTA O NÁVŠTEVNOSTI JEDNOTLIVÝCH E-SHOPOV 

Pre prácu s dátami z API bol použitý programovací jazyk Python v interaktívnom vývojovom prostredí SPYDER. Vo výstupe (format csv) sa nachádzal zoznam všetkých relevantných eshopov v daných segmentoch v zahraničí a ich priemerná mesačná návštevnosť. Tieto údaje následne srovnáme s návštevnosťou lídrov na českom trhu. 

*Bližie informácie o API nie je možné publikovať.

KRÁTKY NÁHLED NA ČÁSTI KÓDU (* celý kód není určený k publikovaniu): 

import csv
import requests
import json
import pandas as pd

#otevření CSV se seznamem domén na zkoušení a jejich přesun do listu, bude treba vzit spravny soubor!!!
domeny=[]
'''with open("output.csv","r")as csvfile:
    spamreader = csv.reader(csvfile, delimiter=' ', quotechar='|')
    for row in spamreader:
        domeny.append(', '.join(row))'''


#časové rozmezí pro data...

... else:
            vysledek = parsed_json["data"][domena]["results"]

            df = pd.DataFrame.from_records(vysledek)
            df["domena"] = domena
            df.to_csv("mujVysledek.csv", sep=",", encoding="utf-8", mode="a",header=False)...



6. POUŽITIE MICROSOFT POWER BI

Pre vytvorenie datového modelu, analýzu dát a ich vizualizáciu sme si zvolili nástroj Microsoft Power BI. Vo výstupnom datasete z AZOR monitoring sme pre potrebu identifikácie jednotlivých trhov vytvorili podmienený stlpec „COUNTRY“. Pri tvorbe datového modelu boli vytvorené samostatné tabulky „Shop“ a „Products“. Do tabulky „Products“ boli pridané stlpce pre výpočet priemerných zahraničných cien prevedených na CZK: 
AVG HU price = AVERAGEX(FILTER(RELATEDTABLE('AZOR CZK');'AZOR CZK'[COUNTRY] = "HU"); 'AZOR CZK'[Price with VAT CZK])

Ďalej boli vytvorené stlpce pre výpočet rozdielu cien CZ i dalších krajín, a ich prevod na percentuálny rozdiel. Aby nedošlo k skresleniu percentuálneho rozdielu kvôli tomu, že sa nejaký produkt v niektorej krajine nepredáva, bol vzorec pre výpočet rozdielu cien upravený následovne: 
Diff CZ-HU = IF(ISBLANK(Products[AVG HU price]); BLANK(); Products[AVG HU price] - Products[AVG CZ price]) % CZ-HU = Products[Diff CZ-HU] / Products[AVG CZ price]

Nad takto pripravenými dátami už bolo možné urobiť samotnú analýzu a dáta následne vizualizovat. 

*Výsledky analýzy nie su určené pre publikovanie.










































































Komentáře

Populární příspěvky z tohoto blogu

Barbora Junová: Podpora začínajícího podnikání zaměřeného na prodej výrobků a poskytování služeb

Gabriela Kubová, Lucie Čuprová: Analýza ruských e-shopů pomocí srovnávače cen Yandex

Kateřina Kolouchová & Lenka Tomešová: Vliv počasí na kriminalitu v New Yorku a Brně