ComeçarComece gratuitamente

Modelagem do conjunto de dados UFO, parte 1

Neste exercício, você criará um modelo k-nearest neighbor para prever em qual país ocorreu o avistamento do UFO. O conjunto de dados X contém a coluna de segundos log-normalizados, as colunas de tipo codificado de uma hora, bem como o mês e o ano em que o avistamento ocorreu. Os rótulos y são a coluna do país codificado, em que 1 é "us" e 0 é "ca".

Este exercício faz parte do curso

Pré-processamento para aprendizado de máquina em Python

Ver Curso

Instruções de exercício

  • Imprima o site .columns do conjunto X.
  • Divida os conjuntos X e y, garantindo que a distribuição de classe dos rótulos seja a mesma nos conjuntos de treinamento e teste, e usando um random_state de 42.
  • Ajuste knn aos dados de treinamento.
  • Imprima a precisão do conjunto de teste do modelo knn.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Take a look at the features in the X set of data
print(____)

# Split the X and y sets
X_train, X_test, y_train, y_test = ____

# Fit knn to the training sets
knn.____

# Print the score of knn on the test sets
print(____)
Editar e executar código