División entrenamiento/prueba + cálculo de la precisión
¡Es hora de practicar la división de tus datos en conjuntos de entrenamiento y de prueba con el conjunto de datos churn_df
!
Se han creado para ti matrices NumPy que contienen las características como X
y la variable objetivo como y
.
Este ejercicio forma parte del curso
Aprendizaje supervisado con scikit-learn
Instrucciones del ejercicio
- Importa
train_test_split
desdesklearn.model_selection
. - Divide
X
yy
en conjuntos de entrenamiento y de prueba, estableciendotest_size
igual al 20 %,random_state
a42
, y asegurándote de que las proporciones de las etiquetas objetivo reflejan las del conjunto de datos original. - Ajusta el modelo
knn
a los datos de entrenamiento. - Calcula e imprime la precisión del modelo para los datos de prueba.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Import the module
from ____ import ____
X = churn_df.drop("churn", axis=1).values
y = churn_df["churn"].values
# Split into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=____, stratify=____)
knn = KNeighborsClassifier(n_neighbors=5)
# Fit the classifier to the training data
____
# Print the accuracy
print(knn.score(____, ____))