Modelización del conjunto de datos UFO, parte 1
En este ejercicio, vas a construir un modelo K vecinos más cercanos para predecir en qué país tuvo lugar el avistamiento de UFO. El conjunto de datos X
contiene la columna de segundos logarítmicos normalizados, las columnas de tipo codificado de un disparo, así como el mes y el año en que se produjo el avistamiento. Las etiquetas y
son la columna del país codificado, donde 1
es "us"
y 0
es "ca"
.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones de ejercicio
- Imprime la página
.columns
del conjuntoX
. - Divide los conjuntos
X
yy
, asegurándote de que la distribución de clases de las etiquetas sea la misma en los conjuntos de entrenamiento y de pruebas, y utilizando unrandom_state
de42
. - Ajusta
knn
a los datos de entrenamiento. - Imprime la precisión del conjunto de pruebas del modelo
knn
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Take a look at the features in the X set of data
print(____)
# Split the X and y sets
X_train, X_test, y_train, y_test = ____
# Fit knn to the training sets
knn.____
# Print the score of knn on the test sets
print(____)