Modelando o conjunto de dados de UFOs, parte 1

Neste exercício, você vai construir um modelo k-nearest neighbor para prever em qual país ocorreu a aparição de UFO. O conjunto X contém a coluna de segundos com log-normalização, as colunas de tipo com one-hot encoding, além do mês e do ano em que a aparição ocorreu. Os rótulos y são a coluna de país codificada, onde 1 é "us" e 0 é "ca".

Este exercício faz parte do curso

Pré-processamento para Machine Learning em Python

Ver curso

Instruções do exercício

Imprima as .columns do conjunto X.
Separe os conjuntos X e y, garantindo que a distribuição de classes dos rótulos seja a mesma nos conjuntos de treino e de teste, e usando random_state igual a 42.
Faça o ajuste de knn aos dados de treino.
Imprima a acurácia no conjunto de teste do modelo knn.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Take a look at the features in the X set of data
print(____)

# Split the X and y sets
X_train, X_test, y_train, y_test = ____

# Fit knn to the training sets
knn.____

# Print the score of knn on the test sets
print(____)

Editar e executar o código