ComenzarEmpieza gratis

KNN sobre datos escalados

La puntuación de precisión en el conjunto de datos wine sin estandarizar era decente, pero veamos lo que puedes conseguir utilizando la estandarización. Una vez más, ya hemos creado el modelo knn así como el conjunto de datos y etiquetas X y y.

Este ejercicio forma parte del curso

Preprocesamiento para machine learning en Python

Ver curso

Instrucciones del ejercicio

  • Crea el método StandardScaler(), almacenado en una variable llamada scaler.
  • Escala las características de entrenamiento y de prueba, teniendo cuidado de no introducir fugas de datos.
  • Ajusta el modelo knn a los datos de entrenamiento.
  • Evalúa el rendimiento del modelo calculando la precisión del conjunto de pruebas.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Instantiate a StandardScaler
scaler = ____

# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)

# Fit the k-nearest neighbors model to the training data
____.____(____, ____)

# Score the model on the test data
print(____.____(____, ____))
Editar y ejecutar código