Klantverloop verkennen
Nu je weet wat klantverloop (churn) is, gaan we de structuur van onze klantgegevensset bekijken, die alvast is ingeladen in een DataFrame genaamd telco. De structuur van je data controleren is een fundamentele stap in het churnmodelleerproces en wordt vaak over het hoofd gezien.
Gebruik pandas-methoden zoals .info() om gevoel te krijgen voor de structuur en let op de verschillende kolommen (in Machine Learning ook wel “features” genoemd), zoals 'CustServ_Calls' (het aantal keren dat de klant de klantenservice belde) en 'State' (de staat waar de klant vandaan komt).
Eén feature is voor ons extra belangrijk: 'Churn'. Deze kan twee waarden aannemen — yes en no — die aangeven of de klant is vertrokken of niet. In deze oefening ga je deze feature verkennen. Je kunt hem benaderen via telco['Churn'].
Hoeveel churners bevat de gegevensset, en hoeveel niet-churners? Om dit snel te beantwoorden kun je de methode .value_counts() gebruiken op telco['Churn'].
Deze oefening maakt deel uit van de cursus
Marketinganalyse: klantverloop voorspellen in Python
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen