Barbora Junová: Podpora začínajícího podnikání zaměřeného na prodej výrobků a poskytování služeb

Podpora začínajícího podnikání zaměřeného na prodej výrobků a poskytování služeb



Barbora Junová



Úvod


Rozhodnout se na začátku Digitální akademie, čeho se bude týkat můj projekt, bylo velmi těžké. Vůbec jsem tehdy totiž netušila, co všechno se za ty necelé dva měsíce zvládnu naučit a jaké budu ovládat nástroje ke zpracování dat. Jelikož jsem nechtěla mít svoji závěrečnou práci pouze na teoretické bázi, jako to bylo u většiny úkolů na vysoké škole, mým nejvýznamnějším kritériem byla praktičnost celé této věci. Po hlubokém zamyšlení konečně přišel on – ten NÁPAD. Ze všech stran jsem na přednáškách slyšela, jak moc je důležité pracovat v jakémkoliv odvětví s daty, ze kterých lze vyčíst téměř cokoliv. Vzpomněla jsem si na kamaráda, který právě rozjížděl svou vlastní firmu a napadlo mě, mu s jeho záměrem pomoct a zároveň tak vyřešit i téma této závěrečné práce. Jak už jsem zmínila, ze začátku jsem neměla absolutně ponětí o tom, co všechno se dá s daty dělat. V první fázi jsme se tedy s mojí nově získanou mentorkou domluvily na práci s Google Analytics a Power BI. 

Techniky a nástroje 

Nejdříve jsem tedy chtěla používat již zmíněné primárně vizualizační nástroje Power BI a Google Analytics. Tyto z převážné části zobrazovací nástroje jsem volila z toho důvodu, že jsem předpokládala práci pouze s fiktivními a vcelku čistými daty. S nápadem dopomoci si k vlastním reálným datům přišla pak i nutnost data důkladně vyčistit. Tato fáze projektu nastala po absolvování hodin Excelu, ze kterých jsem byla naprosto nadšená a chtěla jsem proniknout do tohoto programu proniknout co nejvíce. Začala jsem tedy psát vzorce jako divá a data čistit. Postupem času jsem zjistila, že mnou zvolený způsob, je opravdu zdlouhavý. Dopracovat se k jakýmkoliv výsledkům, mi zabralo opravdu noho času. Nakonec jsem se rozhodla toto mé třídenní snažení zahodit a vše udělat znovu a lépe – tentokrát pomocí programovacího jazyka R. Tuto novou cestu bylo ze začátku těžké prošlapat, jelikož s jazykem R jsme se seznamovaly pouze jednou, a to na úplném začátku Digitální akademie. I přesto, jsem se do toho pustila, protože díky R se mi otevřel skvělý nový prostředek na čištění dat a spojování jednotlivých sloupců.  

Postup

Jak jsem již zmínila, na začátku celého projektu jsem myslela, že budu pracovat s fiktivními daty, které mi poskytne moje mentorka. Se změnou zaměření projektu na skutečná data jsem ale musela oprášit své sociologické znalosti z vysoké školy a vytvořila jsem dotazník. V této chvíli jsem musela najít bezplatný nástroj k distribuci tohoto dotazníku mezi lidi. Nechtěla jsem volit šablony od firmy Google, jelikož neposkytují všechny funkce, které jsem potřebovala. Po dlouhém hledání jsem našla stránku Kvalikvant.cz, která se zdála uživatelsky velmi příjemná a přehledná. Pokud se chcete podívat na tento dotazník, nebo jste pejskař/ka, můžete nám dotazník klidně vyplnit na této adrese (https://kvalikvant.cz/jdi/9b9fe52587). Práce s daty pro kamaráda pro mě tímto projektem nekončí, ale spíše začíná.
Dotazník jsem zde naprogramovala do předpřipravené šablony. Otázky jsem samozřejmě formulovala na základě toho, co si kamarád-zakladatel přál zjistit a co ho mohlo na začátku jeho podnikání popostrčit tím správným směrem. Po vzniku dotazníku jsem udělala pilotážní šetření, kdy byly vychytány vzniklé chybičky a dotazník byl připraven do terénu. Za 3 týdny, co byl dotazník on-line, jej otevřelo 2165 lidí, z toho 748 dokončilo a 1417 opustilo. Hned po exportu dat jsem zjistila, že velké procento lidí, kteří dotazník opustili, tak učinili až na úplném závěru, kde jsme prosili o sdělení jejich e-mailové adresy. Políčko na zadání e-mailové adresy však bylo dobrovolné (mimochodem jsme díky němu získali skoro 1000 e-mailů na majitele psů, což se kamarádovi to se určitě bude někdy hodit).
Bohužel jsem si však hned ze začátku sběru nezkontrolovala, v jaké formě budou exportovaná data – získaná data jsou rozdělena do mnoha sloupců, kdy každá možnost odpovědi má vždy právě jeden svůj sloupec. V tuto chvíli přišel ten největší PROGRES v mé práci, jelikož jsem měla za sebou lekci v programovacím jazyku R a rozhodla jsem se data vyčistit právě s jeho pomocí. Zkusila jsem to i pomocí Excelu, ale R bylo rychlejší, efektivnější a bylo možné celý proces lépe zautomatizovat. Nyní, když doplním nově vzniklé odpovědi, stále se celá tabulka čistí a slučuje do jednotlivých sloupců sama.


Obrázek č. 1: Zde je ukázka příšernosti, kterou mnou vybraná stránka na výrobu dotazníku exportuje. Toto je například výsledek otázky na váhu psa, kde bylo 5 kategorií. V mém případě však tyto hrozná data nejsou na škodu, jelikož jsem se alespoň pořádně naučila spojovat sloupce a celkově čistit data :-D

Postupovala jsem tak, že jsem si nejprve načetla data do nové tabulky q. Zobrazila jsem si dimenze, hlavičku tabulky, sloupec time, sloupec status a názvy sloupců, abych si udělala prvotní přehled a kontrolu, jak tabulka vypadá a co je s ní potřeba dělat. Hned v této fázi jsem si všimla, že program exportuje hodnoty NEZMÍNIL a NEZMINIL, které znamenají to stejné, tudíž jsem obě tyto hodnoty proměnila v prázdné textové pole. Vše jsem udělala pomocí for cyklu. Podobný proces jsem provedla i s hodnotami ZMÍNIL a ZMINIL, ovšem místo prázdného textového pole jsem tyto dvě hodnoty nahradila názvem sloupce. Nicméně tento přístup vyžadoval mravenčí práci, a sice přejmenovat všechny sloupce podle toho, kterou
zastupují odpověď.



Obrázek č. 2: Příkazy, které jsem použila k nahrání a prohlédnutí dat. Dále jsem pomocí for cyklu přejmenovala hodnoty ve sloupci pomocí názvu sloupce.

K pospojování sloupců jsem použila knihovnu tidyr a v ní funkci unite.

Obrázek č. 3: Funkci unite jsem nejprve vygooglila a následně využila nápovědu (?unite) přímo v Rku, kde je přesně popsáno jak se daná funkce využívá.

V této fázi jsem tedy z původních 160 sloupců vytvořila 76 nových sloupců. Tato část byla nejpracnější, jelikož jsem se vždy podívala na původní podobu dokumentu a musela zadat novou podobu sloupce a takto to udělat u celého dotazníku. Samozřejmě zde byly i sloupce, které nepotřebovaly nějakých způsobem spojovat, tudíž jsem je z tabulky q přenesla do tabulky qc bez jakékoliv úpravy.




Obrázek č.4: Šílený kódy na spojování sloupců.

Po této vcelku zdlouhavé transformaci všech dat se tabulka stává přehlednější. Jak jsem již zmiňovala, mnoho lidí opustilo dotazník těsně před požadavkem zadání e-mailu. Rozhodla jsem se, že tato data použiji, jelikož dle mého mají stále vypovídající hodnotu. Zadávám tedy příkaz na odstranění všech řádků, které nemají vyplněno předposlední otázku – tím pádem zde zůstávají pouze řádky, které mají vyplněné buď všechny sloupce, nebo ty řádky, kde chybí pouze poslední sloupec. Samozřejmě se zaměřuji i na maximální a minimální hodnoty, které mohou být zaviněné například překlepem respondenta nebo jeho úmyslným uváděním nerelevantních dat.
Pro export dat do excelu používám knihovnu xlxs a v ní funkci write.xlsx. V tuto chvíli mám již čistá data exportovaná do excelovského formátu a mohu je začít vizualizovat v Power BI.

Obrázek č.5: Instalace knihovny xlxs.

Výsledky


V rámci ochrany dat nebudu v této práci psát konkrétní výsledky. Určitě však mohu nastínit, jakým způsobem jsem při tvorbě vizualizací postupovala a na co jsem se při analýze získaných dat soustředila.
V první řadě jsem se, spíše pro zajímavost, zaměřila na informace o tom, kolik má člověk doma průměrně psů. Mnohem významnější sdělení se týkalo toho, kolik lidé průměrně za psa utrácejí, nebo kolik by byli schopni za nějaké služby pro psy schopni zaplatit. Dále jsem zjišťovala průměrnou váhu a velikost psa a jeho rasu. Tyto informace jsou vhodné pro přizpůsobení jednotlivých výrobků a služeb. Další otázky byly zaměřené na ztrátu a krádež psa. V jednoduchém grafu je jasně znázorněno, zda se jednotliví lidé někdy setkali se ztrátou nebo krádeží psa, popřípadě jakým způsobem tyto situace řešili. V dotazníku došlo k filtraci jednotlivých podotázek, proto neměl-li někdo zkušenost se ztrátou psa, logicky se mu nezobrazila otázka, jak ztrátu řešil. V některých případech byla možná i odpověď ,,jiným způsobem“, kdy mohli respondenti upřesnit tento způsob v podobě otevřené otázky. Tyto odpovědi jsem následně kódovala. Vyprojektovala jsem kategorie, do nichž jsem zařazovala zmíněné odpovědi. Snažila jsem udělat klasifikační kategorie vyčerpávající tím způsobem, že bylo pokryto celé universum možností. Dále jsem dávala pozor na to, aby se jednotlivé kategorie nepřekrývaly, byly jednoznačné a rovnoměrně rozdělené.


Obrázek č.6: Ukázka koláčového a sloupcového grafu.

Další sada otázek se zaměřovala na krmivo. Z výsledných dat lze zřetelně vyčíst, čím nejčastěji lidé své psy krmí, kolik za to utrácí, proč se rozhodli právě pro tento druh krmení, popřípadě jaké značky granulí preferují. Tato data jsem propojila například i s velikostí obce odkud respondent pochází a našla jsem zde jasnou korelaci. Z důvodu ochrany dat nechci uvádět konkrétní výsledky, ale chci pouze naznačit, kolik možností skýtá práce i s takto celkem omezenými daty.





Obrázek č. 7: Ukázka grafu s více proměnnými.

Další dotazy se týkaly způsobu získávání informací, využívaných psích služeb či zájmu o psí služby. Tato data jsem velmi párovala i s věkem respondenta, jelikož zde byla často také velmi silná korelace. Na konci dotazníku byly otázky právě i na demografické údaje, jako je věk respondenta, počet obyvatel v jeho obci bydliště, či kraj ve kterém bydlí. Na základě těchto dat se dá například cílit reklama, místa výdejen daných produktů nebo lokalizace žádaných služeb.
Co se týče finančních údajů, podle mého názoru má lepší vypovídající hodnotu medián nežli průměr. Průměr totiž může vycházet vysoký, protože to ovlivňují enormní částky, které jsou schopní někteří lidé za daný produkt či službu zaplatit. Avšak medián rozdělí skupinu čísel na dvě stejně velké skupiny, tím pádem není ovlivněn extrémními hodnotami. Samozřejmě naprosto nesmyslné až nemožné hodnoty jsem ze vzorku vymazala. Jelikož asi nikdo v České republice nedává za oblečky pro psa 50 000 Kč měsíčně – pokud ano, nepatří do běžné populace, která je naší cílovou skupinou.

 
 Obrázek č. 8: Demonstrace rozdílu mezi průměrem a mediánem.

Závěr

Na základě tohoto mého projektu jsem schopna nově vznikající firmě prezentovat DOPORUČENÍ v podobě empirických dat o názorech a potřebách jednotlivých chovatelů psů. Jedná se o skoro 2000 lidí, což považuji za dostatečně reprezentativní vzorek. Z dat lze například bez problému vyčíst, jakým způsobem majitelé psů své miláčky krmí, jakou značku krmiva nejčastěji kupují, kde si krmivo objednávají, jak si ho nechávají dovézt domů nebo proč se vlastně rozhodli pro tento způsob krmiva. Podobné informace jsem schopna získat i v ostatních oblastech jako je výcvik psa, starost o jeho zdravotní stav, pojištění psa, aktivity vykonávané se psem a další. Několik otázek se týkalo i finanční stránky celé věci, tudíž se dají jednoduše spočítat průměry či mediány, ale i maxima a minima částek, které jsou zákazníci ochotni dát za jednotlivé služby. Tyto informace jsou pro vznikající firmu také velmi důležité, jelikož na jejich základě lze korigovat ceny nově nabízených produktů služeb. 

       Během projektu nás spolu s kamarádem napadlo ještě mnoho dalších vychytávek, jak získávat a využívat data. V dalších projektech už budu chytřejší a spoustu věcí udělám jinak, ale přesně takto funguje progres v poznávání určitého oboru.

        Myslím, že moje spolupráce s touto konkrétní začínající firmou bude pokračovat i nadále a jsem ráda, že mám díky Digitální akademii možnost mému kamarádovi pomoci. Jsem hrdá sama na sebe, že dokážu pomoci druhým lidem při jejich projektech. Hodlám se v analýze dat nadále zdokonalovat a učit se novým věcem.

PS.: Ve volném čase jsem si naprogramovala bankomat do AZ-kvízu v Pythonu. Před dvěma měsíci bych se smála, kdyby mně někdo řekl, že to zvládnu.


Takže určitě všem doporučuji Digitální akademii od Czechitas a holkám a klukům děkuji za super vedení a milou spolupráci. Jmenovitě děkuji své mentorce Janě Babáčkové, která mi věnovala svůj volný čas a podporu při tvoření projektu.

Jsem vděčná nejen za vědomosti, ale i za získaná přátelství <3

 Zdroje

CUESTA, Hector. Analýza dat v praxi. Brno: Computer Press, 2015. ISBN 978-80-251-4361 https://exceltown.com/navody/jazyk-r/propojeni-excelu-s-jazykem-r/ https://datascienceplus.com/data-manipulation-with-tidyr/





Komentáře

  1. Já jsem potřebovala na začátku svého podnikání také podporu, a to finanční :-D . Měla jsem našetřeno málo peněz, tak jsem si musela sjednat nebankovní úvěr na podnikání . Doufala jsem, že se mi bude dařit a budu mít z čeho dluh splácet. Ze začátku to sice vypadalo všelijak, ale nakonec se mi podařilo podnikání rozjet a půjčku splatit :-) .

    OdpovědětVymazat
    Odpovědi
    1. No, koukám, že jsme na tom úplně stejně. Já s podnikáním začal před dvěma lety. A taky jsem měl ze začátku docela velké finanční problémy. Hodně mi z nich pomohla půjčka pro OSVČ kterou jsem si byl nucen vzít. Rád bych řekl, že už ji mám splacenou, ale bohužel, ještě asi půl roku budu splácet. Finančně jsem na tom ale naštěstí už podstatně lépe, tak snad to tak vydrží. :)

      Vymazat
    2. Myslím si, že velká část podnikatelů by bez nějaké finanční podpory prostě začátky nezvládla. Nebyl jsem na tom jinak. Také jsem si do začátku byl nucen peníze půjčit. Musím ale říct, že jsem rád, že teď už se mi v podnikání daří. Dokonce jsem začal uvažovat nad jednou věcí, a to konkrétně jestli by se mi místo podnikání jako OSVČ nevyplatilo spíš založení s.r.o.

      Vymazat
  2. Tento komentář byl odstraněn autorem.

    OdpovědětVymazat
  3. Tak ona ta podpora často není potřeba jen v začátcích. Pokud máte třeba výrobnu, potřebujete pořád řešit nějaké údržby a nákupy nových strojů, abyste se mohli rozrůstat a řešit narůstající poptávku. A u větších strojů, jako jsou třeba šroubové kompresory je to dost velká investice. Pak to chce mí připravený pořádný kapitál nebo si někde půjčit.

    OdpovědětVymazat

Okomentovat

Populární příspěvky z tohoto blogu

Gabriela Kubová, Lucie Čuprová: Analýza ruských e-shopů pomocí srovnávače cen Yandex

Kateřina Kolouchová & Lenka Tomešová: Vliv počasí na kriminalitu v New Yorku a Brně