Dividi i dati in training e testing
Ultimo passo prima di passare alla costruzione del modello di regressione! Qui seguirai i passaggi per identificare i nomi della variabile target e delle colonne delle feature, estrarre i dati e dividerli in training e testing.
Le librerie pandas e numpy sono state caricate rispettivamente come pd e np. Le feature in input sono state importate come insieme di dati features e la variabile target che hai costruito nell'esercizio precedente è stata importata come Y.
Questo esercizio fa parte del corso
Machine Learning per il marketing con Python
Istruzioni dell'esercizio
- Memorizza il nome della colonna identificativa del cliente come lista.
- Seleziona i nomi delle colonne delle feature escludendo l'identificativo del cliente.
- Estrai le feature come
X. - Dividi i dati in training e testing usando la funzione
train_test_split().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Store customer identifier column name as a list
custid = ['___']
# Select feature column names excluding customer identifier
cols = [col for col in features.___ if col not in ___]
# Extract the features as `X`
X = features[___]
# Split data to training and testing
___, test_X, train_Y, ___ = ___(X, Y, test_size=0.25, random_state=99)