Separare target e feature
Per fare una previsione (in questo caso, se un dipendente lascerà o meno), è necessario separare l'insieme di dati in due componenti:
- la variabile dipendente o target, che deve essere predetta
- le variabili indipendenti o feature, che verranno usate per effettuare la previsione
Il tuo compito è separare target e feature. Qui il target è il churn dei dipendenti, mentre le feature includono tutto il resto.
Promemoria: l'insieme di dati è già stato modificato codificando le variabili categoriali e creando le dummies.
pandas è già stato importato come pd.
Questo esercizio fa parte del corso
HR Analytics: prevedere l'abbandono dei dipendenti in Python
Istruzioni dell'esercizio
- Imposta target e feature:
- Seleziona la colonna variabile dipendente (
churn) e assegnala atarget. - Usa
.drop()sulla colonnachurnper impostare tutto il resto comefeature.
- Seleziona la colonna variabile dipendente (
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Set the target and features
# Choose the dependent variable column (churn) and set it as target
target = data.____
# Drop column churn and set everything else as features
features = data.____("____",axis=1)