KNN sobre datos no escalados
Antes de añadir la estandarización a tu flujo de trabajo scikit-learn, primero echarás un vistazo a la precisión de un modelo K vecinos más cercanos en el conjunto de datos wine
sin estandarizar los datos.
Ya se han creado el modelo knn
y los conjuntos de datos y etiquetas X
y y
.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones de ejercicio
- Divide el conjunto de datos en conjuntos de entrenamiento y de prueba.
- Ajusta el modelo
knn
a los datos de entrenamiento. - Imprime la precisión del conjunto de pruebas de tu modelo entrenado
knn
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Split the dataset and labels into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, stratify=y, random_state=42)
# Fit the k-nearest neighbors model to the training data
____
# Score the model on the test data
print(____.____(____, ____))