Modelización del conjunto de datos UFO, parte 1

En este ejercicio, vas a construir un modelo K vecinos más cercanos para predecir en qué país tuvo lugar el avistamiento de UFO. El conjunto de datos X contiene la columna de segundos logarítmicos normalizados, las columnas de tipo codificado de un disparo, así como el mes y el año en que se produjo el avistamiento. Las etiquetas y son la columna del país codificado, donde 1 es "us" y 0 es "ca".

Este ejercicio forma parte del curso

Preprocesamiento para machine learning en Python

Ver curso

Instrucciones del ejercicio

Imprime la página .columns del conjunto X.
Divide los conjuntos X y y, asegurándote de que la distribución de clases de las etiquetas sea la misma en los conjuntos de entrenamiento y de pruebas, y utilizando un random_state de 42.
Ajusta knn a los datos de entrenamiento.
Imprime la precisión del conjunto de pruebas del modelo knn.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Take a look at the features in the X set of data
print(____)

# Split the X and y sets
X_train, X_test, y_train, y_test = ____

# Fit knn to the training sets
knn.____

# Print the score of knn on the test sets
print(____)

Editar y ejecutar código