KNN com dados escalados
A acurácia no conjunto wine sem escalonamento foi razoável, mas vamos ver o que você consegue usando padronização. Mais uma vez, o modelo knn, assim como os dados e rótulos X e y, já foram criados para você.
Este exercício faz parte do curso
Pré-processamento para Machine Learning em Python
Instruções do exercício
- Crie o método
StandardScaler(), guardando-o em uma variável chamadascaler. - Escale as variáveis de treino e de teste, tomando cuidado para não introduzir data leakage.
- Ajuste o modelo
knnaos dados de treino escalados. - Avalie o desempenho do modelo calculando a acurácia no conjunto de teste.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Instantiate a StandardScaler
scaler = ____
# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)
# Fit the k-nearest neighbors model to the training data
____.____(____, ____)
# Score the model on the test data
print(____.____(____, ____))