
Přišel červenec a plánování aktivit pro značky a obchodní kanály je v plném proudu. Plánuje se hlavně podle interních procesů a dat firmy, ale přitom je nutné vnímat kontext trhu – dynamiku kategorie a pozici konkurence. Vyhodnocení trhu je teoreticky samozřejmost, v praxi ale někdy narážíme na to, že zdroje dat jsou drahé, neaktuální, špatně dostupné… Proto snad neuškodí malé cvičení na téma otevřených dat, která mohou pomoci díky své jednoduchosti a okamžité dostupnosti.
Hned na začátku je třeba říct, že otevřená data neexistují ve stejné kvalitě a rozsahu pro všechny kategorie, kanály a značky (definice pojmu otevřených dat zde). V řadě případů ale mohou být dobrou pomůckou a přitom nevyžadují jinou investici než trochu úsilí a času. Přesto nejsou tato data stále běžně využívaná – pokusím se jim proto v tomto krátkém textu dělat advokáta.
Jaké otevřené zdroje dat jsou první volbou
Samozřejmě, k tématu otevřených dat by šlo napsat celou knihu: když se podíváme na Národní katalog otevřených dat, vyskočí na nás informace, že obsahuje 5.636 datových sad. To je poněkud deprimující číslo, zvlášť když si uvědomíme, že Katalog obsahuje jen data veřejné správy a že další data dávají k dispozici soukromé subjekty, případně je lze získat (legálním) těžením on-line zdrojů. O tom, co jsou „data první volby“, bude rozhodovat účel, ke kterému je chceme využít. Celý tento text je tedy jen malým příkladem bez nároku na velké zobecnění.
Co nám mohou otevřená data dát
Pro plánování aktivit, ale i pro jejich zpětné vyhodnocení, pro porovnání pozice značky s trhem i pro pravidelné sledování vývoje jsou důležité tři otázky:
1. Jaká je dynamika trhu?
2. Jaká je pozice a trend naší značky?
3. Jaká je pozice a trend klíčových konkurentů?
Překvapivě, i pro tyto základní marketingové otázky jde nalézt (částečné) odpovědi ve volně dostupných zdrojích.
Jako ukázka hodnotných otevřených dat poslouží vyhledávání klíčových slov na Google, která lze získat jako časové řady přes Trendy Google a jako doplněk k nim využijeme data o průměrné mzdě v ČR z Českého statistického úřadu.
Ukázka využití otevřených dat: kategorie kapslí a kapslových kávovarů
Kategorie byla vybraná proto, že se v ní pohybuje několik silných diferencovaných značek, má jasnou marketingovou vazbu na on-line prostředí a má i zajímavou dynamiku.
Čtyři velké značky působící v kategorii (Nespresso, Dolce Gusto, Tassimo a Tchibo Cafissimo) tvoří její významnou část, ať už jde o samotné kávovary, či o kávové kapsle. Podívejme se tedy na kategorii optikou on-line zájmu o tyto značky, skrz relativní počet lidí, kteří hledají některou ze značek na Google (Trendy Google).
Na prvním grafu (vývoj od počátku roku 2016) vidíme souhrnný zájem o tyto čtyři značky v rozlišení po týdnech (modrá křivka). Zájem o značky postupně rostl, ale ne stále stejným tempem. Také je zřetelné, že je vyhledávání výrazně koncentrované do závěru roku. Pomocí jednoduchého modelu můžeme tato hrubá data „profiltrovat“ a vyčlenit dlouhodobý trend (oranžová křivka). Z něj je vidět, že zájem trvale rostl asi do poloviny roku 2021 a od té doby začíná stagnovat. Současně si můžeme vyfiltrovat „sezónní část“ dat – „vlny“ vypadají zcela pravidelně, ale při detailnějším pohledu se ukáže, že v posledním roce se největší zájem nekoncentruje do týdnů před Vánoci, ale spíš do začátku ledna – nabízí se hypotéza, že se zájem aktuálně přesouvá do povánočních slev.
Co ta čísla prakticky znamenají?
Vyhledávání značek může být ze strany konkrétních lidí jak spontánní (například došly kapsle, hledám dárek), tak vyvolané aktivitami značky (reklamní kampaň, spotřebitelská soutěž, akce…). Vyhledávání značek sice nemusí přímo indikovat ochotu nakoupit, přesto jde o extrémně důležitý ukazatel. Měří zájem o značku v klíčovém „prostoru“, v němž se pohybuje, její mentální dopad na zásadní část populace. Patrně bychom dnes našli málo značek (produktů, služeb, obchodníků…), které si mohou dovolit ignorovat on-line svět.
Navíc jsou tato data dostupná v detailním časovém rozlišení a aktualizovaná na denní bázi. Umožňují například ověřit, jestli se marketingové aktivity projevují ve zvýšení zájmu o značku či nikoli – dokonce i to, jestli z konkrétní aktivity netěží víc celá kategorie než naše vlastní značka. A naopak, sezonalita ukazuje, kdy je nejvhodnější čas pro start aktivační kampaně. Při přepočítání na podílová čísla (naše značka vs. hlavní konkurenti) lze sledovat i „mentální podíl“ značky, což indikuje rozsah obchodního potenciálu. Pakliže mentální podíl značky zásadně neodpovídá prodejům, je namístě uvažovat, proč se tak děje.
První na řadě je ale dynamika kategorie jako celku. Když vidíme v posledních měsících náznaky stagnace zájmu o kategorii kapslí a kapslových kávovarů, vnucuje otázka, jestli dokážeme odhadnout vývoj v dalších měsících. Takový model samozřejmě postavit lze – viz další graf, kde je modrá čára dosavadních dat následovaná oranžovou čárou s predikovaným vývojem. Predikce zájmu o kategorii je vcelku optimistická: model předpokládá, že se sezónní zájem více méně vrátí ke stavu roku 2021/2020. Zde je ale třeba jasně varovat: každý prediktivní model se učí na historických datech. Jestliže se ocitneme v situaci, která je historicky unikátní, přelomová, nemusí predikce fungovat. To je efekt „černé labutě“, noční můra všech, kdo zkoušejí predikovat vývoj trhu – a o černé labutě (Covid, válka na Ukrajině, ceny vstupů, ceny spotřebitelské atd. atd.) není bohužel v posledních letech nouze.
Jak dál k pozici značky
Přepočet dat o hledání značky na její „mentální podíl“ je jednoduchý a vyžaduje jen definovat seznam značek relevantních pro kategorii. Data (Trendy Google) ale umožňují jít ještě o krok dál: změřit regionální rozdíly v pozici značky. Na příkladu zájmu o značku Nespresso vidíme, že regionální rozdíly jsou značné: její „mentální podíl“ (v rámci čtyř sledovaných značek) se v jednotlivých krajích pohybuje mezi 28 % a 58 %. Prostým porovnáním mapky podílu značky s mapkou průměrné mzdy (data ČSÚ) je vidět jasná souvislost. Hypotéza se vnucuje na první pohled: Nespresso má silnější pozici v regionech, kde je vyšší kupní síla. Zde je ale třeba být opatrný, protože souvislost může být povrchní a nemusí znamenat příčinný vztah: regiony, kde je Nespresso nejsilnější (Praha a Středočeský kraj a Jihomoravský kraj), jsou současně regiony, kde jsou lépe dostupné kamenné prodejny Nespresso… a takových „vysvětlení“ bychom mohli najít víc. Zobrazená data tedy mohou upozornit na souvislosti, ale nejsou dostatečná pro kategorické závěry.
Na závěr
Každá kategorie se v on-line světě bude chovat jinak a pro některé kategorie nemusí relevantní otevřená data vůbec existovat. V každém případě však tyto zdroje stojí za pozornost a zaslouží si dostat ve značkovém marketingu šanci. Jednoduchost je jejich výhodou i nevýhodou: neposlouží každému účelu, na druhé straně je lze získat a zpracovat rychle, s minimálními náklady a často jsou zcela aktuální.
Na závěr zdůrazňuji, že v uvedených příkladech byla využita jen otevřená data a že datové analýzy byly provedené ve volně dostupném software (R Core Team (2023). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. Výjimkou je využití standardního balíku MS Office pro tvorbu grafů.
Zdeněk Skála, jednatel, Skála a Šulc s.r.o.