Modelagem do conjunto de dados UFO, parte 1
Neste exercício, você criará um modelo k-nearest neighbor para prever em qual país ocorreu o avistamento do UFO. O conjunto de dados X contém a coluna de segundos log-normalizados, as colunas de tipo codificado de uma hora, bem como o mês e o ano em que o avistamento ocorreu. Os rótulos y são a coluna do país codificado, em que 1 é "us" e 0 é "ca".
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções do exercício
- Imprima o site
.columnsdo conjuntoX. - Divida os conjuntos
Xey, garantindo que a distribuição de classe dos rótulos seja a mesma nos conjuntos de treinamento e teste, e usando umrandom_statede42. - Ajuste
knnaos dados de treinamento. - Imprima a precisão do conjunto de teste do modelo
knn.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Take a look at the features in the X set of data
print(____)
# Split the X and y sets
X_train, X_test, y_train, y_test = ____
# Fit knn to the training sets
knn.____
# Print the score of knn on the test sets
print(____)