Codifica di feature binarie
Riassegnare i tipi di dato è una parte importante del preprocessing dei dati. In questo esercizio assegnerai il valore 1 a 'yes' e 0 a 'no' per le feature 'Vmail_Plan' e 'Churn', rispettivamente.
Nel video hai visto due approcci per farlo: uno con pandas e l'altro con scikit-learn. Per compiti semplici come questo, è consigliabile restare su pandas, quindi è quello che useremo qui. Se invece vuoi costruire pipeline di Machine Learning — che va oltre lo scopo di questo corso — puoi esplorare l'uso di LabelEncoder(). Quando fai data science, è importante ricordare che c'è sempre più di un modo per portare a termine un'attività, e devi scegliere quello più efficace per la tua applicazione.
Questo esercizio fa parte del corso
Marketing Analytics: Prevedere il churn dei clienti in Python
Istruzioni dell'esercizio
- Sostituisci
'no'con0e'yes'con1nella colonna'Vmail_Plan'ditelco. - Fai lo stesso per la colonna
'Churn'.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Replace 'no' with 0 and 'yes' with 1 in 'Vmail_Plan'
telco['Vmail_Plan'] = telco['____'].____(____)
# Replace 'no' with 0 and 'yes' with 1 in 'Churn'
telco['Churn'] = ____
# Print the results to verify
print(telco['Vmail_Plan'].head())
print(telco['Churn'].head())