IniziaInizia gratis

Divisione treno/test + calcolo dell'accuratezza

È il momento di esercitarsi a suddividere i dati in set di allenamento e test con il dataset churn_df!

Sono stati creati degli array NumPy contenenti le caratteristiche come X e la variabile di destinazione come y.

Questo esercizio fa parte del corso

Apprendimento supervisionato con scikit-learn

Visualizza il corso

Istruzioni dell'esercizio

  • Importa train_test_split da sklearn.model_selection.
  • Dividere X e y in set di formazione e test, impostando test_size uguale al 20%, random_state a 42 e assicurando che le proporzioni delle etichette target riflettano quelle del dataset originale.
  • Adatta il modello knn ai dati di formazione.
  • Calcola e stampa l'accuratezza del modello per i dati di prova.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import the module
from ____ import ____

X = churn_df.drop("churn", axis=1).values
y = churn_df["churn"].values

# Split into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=____, stratify=____)
knn = KNeighborsClassifier(n_neighbors=5)

# Fit the classifier to the training data
____

# Print the accuracy
print(knn.score(____, ____))
Modifica ed esegui il codice