Divisione treno/test + calcolo dell'accuratezza
È il momento di esercitarsi a suddividere i dati in set di allenamento e test con il dataset churn_df!
Sono stati creati degli array NumPy contenenti le caratteristiche come X e la variabile di destinazione come y.
Questo esercizio fa parte del corso
Apprendimento supervisionato con scikit-learn
Istruzioni dell'esercizio
- Importa
train_test_splitdasklearn.model_selection. - Dividere
Xeyin set di formazione e test, impostandotest_sizeuguale al 20%,random_statea42e assicurando che le proporzioni delle etichette target riflettano quelle del dataset originale. - Adatta il modello
knnai dati di formazione. - Calcola e stampa l'accuratezza del modello per i dati di prova.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the module
from ____ import ____
X = churn_df.drop("churn", axis=1).values
y = churn_df["churn"].values
# Split into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=____, stratify=____)
knn = KNeighborsClassifier(n_neighbors=5)
# Fit the classifier to the training data
____
# Print the accuracy
print(knn.score(____, ____))