Supprimer les variables inutiles
Certaines variables comme 'Area_Code' et 'Phone' n’aident pas à prédire le churn client et doivent être supprimées avant le modeling. En Python, le moyen le plus simple est d’utiliser la méthode .drop() des DataFrames pandas, comme vu dans la vidéo où 'Soc_Sec' et 'Tax_ID' ont été supprimées :
telco.drop(['Soc_Sec', 'Tax_ID'], axis=1)
Ici, axis=1 indique que vous voulez supprimer 'Soc_Sec' et 'Tax_ID' des colonnes.
Cet exercice fait partie du cours
Marketing Analytics : prédire l’attrition client en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Drop the unnecessary features
telco = ____