IniziaInizia gratis

Dividi i dati in training e testing

Ultimo passo prima di passare alla costruzione del modello di regressione! Qui seguirai i passaggi per identificare i nomi della variabile target e delle colonne delle feature, estrarre i dati e dividerli in training e testing.

Le librerie pandas e numpy sono state caricate rispettivamente come pd e np. Le feature in input sono state importate come insieme di dati features e la variabile target che hai costruito nell'esercizio precedente è stata importata come Y.

Questo esercizio fa parte del corso

Machine Learning per il marketing con Python

Visualizza il corso

Istruzioni dell'esercizio

  • Memorizza il nome della colonna identificativa del cliente come lista.
  • Seleziona i nomi delle colonne delle feature escludendo l'identificativo del cliente.
  • Estrai le feature come X.
  • Dividi i dati in training e testing usando la funzione train_test_split().

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Store customer identifier column name as a list
custid = ['___']

# Select feature column names excluding customer identifier
cols = [col for col in features.___ if col not in ___]

# Extract the features as `X`
X = features[___]

# Split data to training and testing
___, test_X, train_Y, ___ = ___(X, Y, test_size=0.25, random_state=99)
Modifica ed esegui il codice