KNN sobre datos escalados
La puntuación de precisión en el conjunto de datos wine
sin estandarizar era decente, pero veamos lo que puedes conseguir utilizando la estandarización. Una vez más, ya hemos creado el modelo knn
así como el conjunto de datos y etiquetas X
y y
.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones del ejercicio
- Crea el método
StandardScaler()
, almacenado en una variable llamadascaler
. - Escala las características de entrenamiento y de prueba, teniendo cuidado de no introducir fugas de datos.
- Ajusta el modelo
knn
a los datos de entrenamiento. - Evalúa el rendimiento del modelo calculando la precisión del conjunto de pruebas.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Instantiate a StandardScaler
scaler = ____
# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)
# Fit the k-nearest neighbors model to the training data
____.____(____, ____)
# Score the model on the test data
print(____.____(____, ____))