Customer churn, czyli "odpływ klientów" - dotyczy głównie usług ciągłych, np telekomunikacji, telewizji, dostawców energii czy ubezpieczeń. Jego miara świadczy o tym, jak chętnie klienci zostają z naszą firmą, a ilu rezygnuje, czy odchodzi do konkurencji. Z racji, że pozyskanie nowego klienta jest zwykle dużo droższe niż jego utrzymanie, minimalizacja customer churn pozwala zwiększyć sprzedaż przy stosunkowo niewielkim nakładzie finansowym.

Wprowadzenie

W tym wpisie przedstawimy analizę zbioru danych klientów operatora sieci telefonicznej. Celem jest zbadanie przyczyn rezygnacji klientów z usług firmy oraz stworzenie algorytmu pozwalającego ocenić szanse na odejście konkretnego użytkownika. Operator dowie się jak wygląda struktura jego klientów oraz które usługi nie spełniają ich oczekiwań.  Pozwoli to na wcześniejszy kontakt i zaproponowanie lepszej oferty osobie potencjalnie mogącej zrezygnować ze współpracy.  

Zbiór użyty we wpisie opublikowany został przez firmę IBM w celach edukacyjnych. Został on już zanonimizowany oraz zadbano o spójność danych.

Analiza - czynniki determinujące odejście klienta

Celem analizy jest znalezienie grup szczególnie narażonych na odejście od operatora. Pośród nich znaleźliśmy trzy mocno niezbilansowane grupy. 

Pierwszą z nich są seniorzy. Stanowią oni co prawda jedynie 16 % użytkowników jednak odchodzi ponad 41 %, prawie dwa razy więcej w porównaniu do pozostałych użytkowników (23 %). Może to oznaczać, że oferta nie jest dostosowana do ich potrzeb. 

Kolejnym czynnikiem jest typ umowy. Osoby przedłużające umowę co miesiąc zdecydowanie częściej odchodzą niż klienci na dłuższych kontraktach. Nie mamy niestety dostępu do danych określających ile z nich jest na przykład obcokrajowcami, zainteresowanymi jedynie chwilową współpracą. Pozostałe osoby należy zachęcać do przejścia na dłuższe okresy.

Ostatnim wyraźnym problemem operatora są usługi internetowe. Jakość działania usług światłowodowych pozostawia wiele do życzenia na tle konkurencji.

Kolejnym czynnikiem są miesięczne opłaty. Widocznym zjawiskiem jest większe zadowolenie użytkowników tanich pakietów.

Mankamentem danych jest brak określenia daty zrezygnowania z usług firmy. Nie jesteśmy bowiem w stanie sprawdzić czy jakość tych usług została już poprawiona. W dalszej części analizy przyjmujemy, że dane dotyczą aktualnych ofert. 

Analiza - inne przyczyny?

Przyjrzyjmy się również macierzy korelacji. Siła korelacji pokazuje czy istnieje liniowa zależność pomiędzy zmiennymi. Oczywiście jej istnienie nie jest jeszcze dowodem na to, że pomiędzy zmiennymi rzeczywiście zachodzi ciąg przyczynowo skutkowy.  W tym przypadku nie dostarcza ona jednak żadnych podpowiedzi. Mocno skorelowane są jedynie oczywiste pary: miesięczna opłata i całkowita opłata, oraz całkowita opłata i staż klienta. Korelacja pomiędzy znalezionymi grupami jest niewielka, możemy więc wnioskować, że są rozdzielne i stanowią osobne problemy. 

 

Dwa kolejne wykresy pokazują krytyczny czas odejścia użytkowników rozliczających się co miesiąc. Widzimy, że około 20% rezygnuje po pierwszym miesiącu. Możliwe, że są to klienci okazjonalni, np zagraniczni, których nie da się utrzymać

Modele predykcyjne - przewidzieć zachowanie klienta

Na podstawie danych przygotowano modele predykcyjne. Ich celem jest przewidywanie który klient potencjalnie chce opuścić operatora. Dzięki temu będzie mógł przedstawić mu korzystniejszą ofertę i potencjalnie zatrzymać go przy sobie. 

 

Przyjęliśmy, że bardziej wskazane jest popełnienie błędu polegającego na zaproponowaniu lepszej oferty osobie, która nie potrzebowałaby zachęty do pozostania niż zaniechaniu propozycji osobie wahającej się.

Pierwszy model - przygotowany dla całej puli klientów zaklasyfikował dobrze 80 %  przypadków. Przygotowane zostały również modele dla każdej z wyszczególnionych grup:

  • seniorów
  • telefonów “na kartę”
  • użytkowników usług internetowych

Model skoncentrowany na seniorach osiągnął 70 % skuteczność. Model użytkowników internetu wykazuje się skutecznością 83 % a dla użytkowników telefonu na kartę 65 %. Co ciekawe w każdym przypadku kluczowe znaczenie miała cena usług. 

Wnioski

Naszym głównym celem było zidentyfikowanie przyczyn i zminimalizowanie ilości odchodzących klientów. Wykorzystując metody analizy danych, byliśmy w stanie zidentyfikować potencjalne przyczyny odejścia, co pozwoli podjąć odpowiednie decyzje biznesowe i lepiej dostosować ofertę do klientów.

Stworzyliśmy również modele predykcyjne, które poprawnie identyfikują zachowanie 4 na 5 klientów

Dzięki nim operator może z wyprzedzeniem zareagować, aby utrzymać klienta - np przygotowując indywidualną ofertę na specjalnych warunkach.