ComenzarEmpieza gratis

División entrenamiento/prueba + cálculo de la precisión

¡Es hora de practicar la división de tus datos en conjuntos de entrenamiento y de prueba con el conjunto de datos churn_df!

Se han creado para ti matrices NumPy que contienen las características como X y la variable objetivo como y.

Este ejercicio forma parte del curso

Aprendizaje supervisado con scikit-learn

Ver curso

Instrucciones del ejercicio

  • Importa train_test_split desde sklearn.model_selection.
  • Divide X y y en conjuntos de entrenamiento y de prueba, estableciendo test_size igual al 20 %, random_state a 42, y asegurándote de que las proporciones de las etiquetas objetivo reflejan las del conjunto de datos original.
  • Ajusta el modelo knn a los datos de entrenamiento.
  • Calcula e imprime la precisión del modelo para los datos de prueba.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Import the module
from ____ import ____

X = churn_df.drop("churn", axis=1).values
y = churn_df["churn"].values

# Split into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=____, stratify=____)
knn = KNeighborsClassifier(n_neighbors=5)

# Fit the classifier to the training data
____

# Print the accuracy
print(knn.score(____, ____))
Editar y ejecutar código