Binaire features encoden
Het omzetten van datatypes is een belangrijk onderdeel van data preprocessing. In deze oefening ken je de waarde 1 toe aan 'yes' en 0 aan 'no' voor de features 'Vmail_Plan' en 'Churn'.
In de video zag je twee manieren om dit te doen: één met pandas en één met scikit-learn. Voor eenvoudige taken als deze is het aan te raden bij pandas te blijven, dus dat doen we in deze oefening. Als je daarentegen Machine Learning-pijplijnen wilt bouwen — wat buiten de scope van deze cursus valt — kun je LabelEncoder() gebruiken. Bij data science is het belangrijk te beseffen dat er bijna altijd meerdere manieren zijn om een taak uit te voeren; kies de aanpak die het meest effectief is voor jouw toepassing.
Deze oefening maakt deel uit van de cursus
Marketinganalyse: klantverloop voorspellen in Python
Oefeninstructies
- Vervang
'no'door0en'yes'door1in de kolom'Vmail_Plan'vantelco. - Doe hetzelfde voor de kolom
'Churn'.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Replace 'no' with 0 and 'yes' with 1 in 'Vmail_Plan'
telco['Vmail_Plan'] = telco['____'].____(____)
# Replace 'no' with 0 and 'yes' with 1 in 'Churn'
telco['Churn'] = ____
# Print the results to verify
print(telco['Vmail_Plan'].head())
print(telco['Churn'].head())