
Żyjemy w świecie, w którym ilość danych rośnie wykładniczo, a coraz więcej wysiłku wkłada się w ich lepsze wykorzystanie. Marketerzy mają dziś do dyspozycji więcej niż wystarczającą ilość danych, ale szukają lepszych sposobów wykorzystania i łączenia swoich zestawów danych w celu uzyskania głębszych, bardziej wartościowych spostrzeżeń.
Wyzwanie leży w sposobie, w jaki patrzymy na zastosowanie nauki o danych i sposobie, w jaki my, jako naukowcy zajmujący się danymi, zostaliśmy przeszkoleni. Pracując przez lata nad projektami z zakresu nauki o danych i analityki, byłem w stanie dostrzec łatwiejszy sposób na osiągnięcie większych, bardziej śmiałych celów.
Jest to czteroetapowy proces:
- Zacznij od ambitnego wyniku
- Podziel wynik na mniejsze zestawy działań
- Przeglądanie danych i przeprowadzanie analizy (iteracyjne)
- Powiązanie wyników z ustalonym rezultatem
Proces ten działa lepiej niż tradycyjny proces rozwiązywania problemów w nauce o danych, ponieważ zmniejsza niejednoznaczność i napędza dążenie do wyników u wszystkich zaangażowanych osób. Tradycyjny proces nauki o danych zwykle rozpoczyna się od określenia problemu, a następnie przechodzi do gromadzenia danych, modelowania danych i oceny. U podstaw tradycyjnego procesu nauki o danych leży złożoność. Złożoność generalnie zmusza nas do bardziej racjonalnego, analitycznego myślenia i nie zmusza nas do wykorzystywania naszej kreatywności. Z drugiej strony ambicja zachęca nas do rozpoczęcia od kreatywnego myślenia, a następnie przejścia do analitycznej strony mózgu.
Teraz podzielmy nasz proces na poszczególne kroki.
Zacznij od ambitnego wyniku
Załóżmy, że chcesz osiągnąć 5% dodatkowego udziału w następnym roku. Najpierw zdefiniuj swój ambitny cel. W tym przypadku jest to 5% więcej udziałów. Psychologia behawioralna mówi, że ważne jest pozytywne przeformułowanie celu, ponieważ nakłania to umysł do bardziej kreatywnego myślenia w celu osiągnięcia celów.
W tym przykładzie załóżmy, że chcesz zwiększyć udział poprzez rozszerzenie sieci dystrybucji w Indonezji. Indonezja jest bardzo rozdrobnionym geograficznie krajem z 17 000 wysp, a transport jest wyzwaniem. Aby to osiągnąć, celem jest dotarcie od 50% do 80% rynku przy najniższych możliwych kosztach, a wszystko to w ciągu roku.
Podziel swój wynik na mniejsze zestawy działań
Ma to kluczowe znaczenie, ponieważ chcesz podzielić swój duży, ambitny wynik na mniejsze, łatwe do zarządzania zestawy. Pomaga to również podzielić dane na "wzajemnie wykluczające się, zbiorczo wyczerpujące" zestawy. Pomaga to podzielić je na wiele celów cząstkowych i przyspieszyć proces. W naszym przykładzie podzieliliśmy wynik na trzy zestawy działań:
- Gęste obszary geograficzne wymagające konfiguracji dystrybutora
- Rozproszone obszary geograficzne wymagające konfiguracji pod-dystrybutorów
- Rosnące skupiska ludności
Przeglądanie zestawów danych i uruchamianie analizy
To duża część tego procesu. Zacznij od zbadania źródeł danych i wymienienia tego, co jest dostępne, a co nie (ale jest niezbędne). W tym przykładzie możemy użyć spisu detalicznego Nielsen i danych panelu detalicznego z różnymi funkcjami, takimi jak wielkość sklepu, sprzedaż w sklepie, współrzędne lokalizacji sklepu itp. Następnie możemy zintegrować te dwa zestawy danych, aby uzyskać szereg znaczących cech.
Dostrzegamy jednak również obszary, w których nasze zbiory danych są niewystarczające. W takim przypadku może się okazać, że istnieje spory obszar poza naszym zakresem detalicznym. W rezultacie możemy nie mieć pewnych rodzajów informacji, takich jak liczba ludności, liczba banków, które mogą wskazywać na dobrobyt i inne dane. Musimy więc zidentyfikować inne źródła, takie jak spisy ludności, aby uzyskać te cechy.
Te zestawy danych są następnie łączone i poddawane modelowi regresji wielorakiej, który identyfikuje możliwości dla każdego obszaru/miejscowości.
Prawdopodobnie konieczne będzie wykonanie kilku iteracji, aby zapewnić dokładność przewidywań. Wreszcie, dane te można połączyć z danymi klienta lub danymi dystrybucji pierwszej strony.
Powiązanie wyników z rezultatami
Ostatnim krokiem jest powiązanie wszystkich wyników zestawów akcji.
W tym przykładzie jesteśmy w stanie wykorzystać te dane do narysowania klastrów obszarów/bloków, które zapewniają największe możliwości i mogą być realistycznie obsługiwane przez istniejącą sieć dystrybucji przy niewielkim zwiększeniu ich promienia i utworzeniu kilku pod-dystrybutorów w rosnących klastrach.
W tym przykładzie jesteśmy w stanie połączyć wiele zestawów danych, aby dostarczyć proste rozwiązanie, które nakreśla jasne rozwiązanie dużego, ambitnego celu. To pokazuje, że nie zawsze opłaca się zaczynać od określenia problemu, ale raczej od pozytywnego, ambitnego celu.
Więc następnym razem, gdy zaczniesz nowy projekt, daj szansę temu procesowi i zacznij od ambitnego celu i kreatywnego myślenia.



