Modelando o conjunto de dados de UFOs, parte 1
Neste exercício, você vai construir um modelo k-nearest neighbor para prever em qual país ocorreu a aparição de UFO. O conjunto X contém a coluna de segundos com log-normalização, as colunas de tipo com one-hot encoding, além do mês e do ano em que a aparição ocorreu. Os rótulos y são a coluna de país codificada, onde 1 é "us" e 0 é "ca".
Este exercício faz parte do curso
Pré-processamento para Machine Learning em Python
Instruções do exercício
- Imprima as
.columnsdo conjuntoX. - Separe os conjuntos
Xey, garantindo que a distribuição de classes dos rótulos seja a mesma nos conjuntos de treino e de teste, e usandorandom_stateigual a42. - Faça o ajuste de
knnaos dados de treino. - Imprima a acurácia no conjunto de teste do modelo
knn.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Take a look at the features in the X set of data
print(____)
# Split the X and y sets
X_train, X_test, y_train, y_test = ____
# Fit knn to the training sets
knn.____
# Print the score of knn on the test sets
print(____)