Modelagem do conjunto de dados UFO, parte 1
Neste exercício, você criará um modelo k-nearest neighbor para prever em qual país ocorreu o avistamento do UFO. O conjunto de dados X
contém a coluna de segundos log-normalizados, as colunas de tipo codificado de uma hora, bem como o mês e o ano em que o avistamento ocorreu. Os rótulos y
são a coluna do país codificado, em que 1
é "us"
e 0
é "ca"
.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções de exercício
- Imprima o site
.columns
do conjuntoX
. - Divida os conjuntos
X
ey
, garantindo que a distribuição de classe dos rótulos seja a mesma nos conjuntos de treinamento e teste, e usando umrandom_state
de42
. - Ajuste
knn
aos dados de treinamento. - Imprima a precisão do conjunto de teste do modelo
knn
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Take a look at the features in the X set of data
print(____)
# Split the X and y sets
X_train, X_test, y_train, y_test = ____
# Fit knn to the training sets
knn.____
# Print the score of knn on the test sets
print(____)