Overbodige features verwijderen
Sommige features, zoals 'Area_Code' en 'Phone', zijn niet nuttig om klantverloop te voorspellen en moeten vóór het modelleren worden verwijderd. De makkelijkste manier om dit in Python te doen is met de .drop()-methode van pandas-DataFrames, precies zoals je in de video zag, waar 'Soc_Sec' en 'Tax_ID' werden verwijderd:
telco.drop(['Soc_Sec', 'Tax_ID'], axis=1)
Hier geeft axis=1 aan dat je 'Soc_Sec' en 'Tax_ID' uit de kolommen wilt verwijderen.
Deze oefening maakt deel uit van de cursus
Marketinganalyse: klantverloop voorspellen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Drop the unnecessary features
telco = ____