Dividi i dati in training e testing

Ultimo passo prima di passare alla costruzione del modello di regressione! Qui seguirai i passaggi per identificare i nomi della variabile target e delle colonne delle feature, estrarre i dati e dividerli in training e testing.

Le librerie pandas e numpy sono state caricate rispettivamente come pd e np. Le feature in input sono state importate come insieme di dati features e la variabile target che hai costruito nell'esercizio precedente è stata importata come Y.

Questo esercizio fa parte del corso

Machine Learning per il marketing con Python

Visualizza corso

Istruzioni dell'esercizio

Memorizza il nome della colonna identificativa del cliente come lista.
Seleziona i nomi delle colonne delle feature escludendo l'identificativo del cliente.
Estrai le feature come X.
Dividi i dati in training e testing usando la funzione train_test_split().

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Store customer identifier column name as a list
custid = ['___']

# Select feature column names excluding customer identifier
cols = [col for col in features.___ if col not in ___]

# Extract the features as `X`
X = features[___]

# Split data to training and testing
___, test_X, train_Y, ___ = ___(X, Y, test_size=0.25, random_state=99)

Modifica ed esegui il codice