KNN em dados escalonados
A pontuação de precisão no conjunto de dados wine
sem escala foi decente, mas vamos ver o que você pode conseguir usando a padronização. Mais uma vez, o modelo knn
, bem como o conjunto de dados e rótulos X
e y
já foram criados para você.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções de exercício
- Crie o método
StandardScaler()
, armazenado em uma variável chamadascaler
. - Dimensione os recursos de treinamento e teste, tomando cuidado para não introduzir vazamento de dados.
- Ajuste o modelo
knn
aos dados de treinamento em escala. - Avalie o desempenho do modelo calculando a precisão do conjunto de testes.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Instantiate a StandardScaler
scaler = ____
# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)
# Fit the k-nearest neighbors model to the training data
____.____(____, ____)
# Score the model on the test data
print(____.____(____, ____))