1R8A7689

Wessel Luijben – Lead Data Science en Deep Learning Expert

 

Welke klanten van mijn website gaan de sprong naar de concurrent maken? De Churn-methode helpt je die klanten op te sporen.

De uitdaging van Data Science zit hem niet in het implementeren van een algoritme, maar in het in real-time aanspreken van de juiste algoritmes om antwoord op je vraag te vinden. In dit geval is de vraag: hoeveel klanten gaan mijn klantenbestand verlaten? Oftewel, wat is mijn Churn-rate?

Interactieve data science track

Er zijn meerdere redenen om naar Churn te kijken, maar de belangrijkste is: het levert geld op. Churn is een investering die zich binnen een paar maanden terugverdient. Denk aan RTL, denk aan NOS, denk aan de mediabedrijven die Maarten Toet noemde; zij zouden Churn moeten gebruiken. Heb je een beeld van klanten die mogelijk de sprong naar een concurrent gaan maken, dan kun je daarop inspelen. Geef de werknemers in je callcenter bijvoorbeeld een lijst met klanten die op basis van je analyse het meest waarschijnlijk zijn de jump te maken. Spreek hen aan met speciale aanbiedingen, focus daar je aandacht op.

“Een echt goed Churn-model gebruikt al je data”

Een goed Churn-model bouw je op basis van drie belangrijke stappen: aanwezige data inzichtelijk maken, beginnen met een simpel model, en je performance analyseren. Op basis van die analyse verbeter je je model en keer je terug naar stap 1.

Voor dit proces heb je goede Data Scientists nodig. Een goede Data Scientist is iemand die het probleem herkent en daar een juist algoritme bij weet te vinden. Dat doet hij op basis van drie archetypen problemen: classificatie (is het A of is het niet A?), regressie (is het 1 of 10 of iets ertussenin?) en clustering (is mijn data in te delen in groepen?). Zulke archetypen zijn meestal niet exclusief; het is aan de Data Scientist om te juiste combinatie te herkennen en op basis daarvan een of meerdere algoritmes toe te passen.

Terug naar Churn

Tijd om bovenstaande op een concrete simpele case toe te passen. Er is klantendata en je wilt weten welke klant gaat ontsnappen. Je begint met een simpel model: op welke regiocodes zijn de trouwste klanten te vinden? Trouw meet je bijvoorbeeld op basis van de hoeveelheid aankopen. Op basis van die twee inputs bereken je een coëfficiënt van de kans dat iemand overstapt naar de concurrent. Wie een hoog coefficient heeft, moet aandacht krijgen. Vervolgens kijk je in hoeveel gevallen het geselecteerde algoritme de juiste voorspelling deed.

Door deze stappencyclus te herhalen leer je steeds beter welke attributen belangrijk zijn. In eerste instantie zijn dat de regiocode (je ziet meteen van welke gebieden je nog geen data hebt; tijd om op zoek te gaan!) en transaction count – verder heb je vooral veel onbruikbare data. Maar hoe vaker je de cyclus herhaalt, hoe meer manieren te vindt om de data naar jouw voordeel te gebruiken.

De laatste stap: wanneer interpreteer je data als een zekere ja of nee? Je wilt een mate van zekerheid, je wilt weten of je je algoritmes kunt vertrouwen in de praktijk en de data kunt gebruiken om je aandacht inderdaad op specifieke klanten te gaan focussen. Dat doe je door decision rules op te stellen, die je natuurlijk weer opstelt op basis van een herhaling van stappen.

Dat is Churn in een notendop.

 

 

datadonderdag9-2

 

 

Delen:
Facebooktwittergoogle_pluslinkedin

LEAVE A REPLY

Het e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *