Modelización del conjunto de datos UFO, parte 1
En este ejercicio, vas a construir un modelo K vecinos más cercanos para predecir en qué país tuvo lugar el avistamiento de UFO. El conjunto de datos X contiene la columna de segundos logarítmicos normalizados, las columnas de tipo codificado de un disparo, así como el mes y el año en que se produjo el avistamiento. Las etiquetas y son la columna del país codificado, donde 1 es "us" y 0 es "ca".
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones del ejercicio
- Imprime la página
.columnsdel conjuntoX. - Divide los conjuntos
Xyy, asegurándote de que la distribución de clases de las etiquetas sea la misma en los conjuntos de entrenamiento y de pruebas, y utilizando unrandom_statede42. - Ajusta
knna los datos de entrenamiento. - Imprime la precisión del conjunto de pruebas del modelo
knn.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Take a look at the features in the X set of data
print(____)
# Split the X and y sets
X_train, X_test, y_train, y_test = ____
# Fit knn to the training sets
knn.____
# Print the score of knn on the test sets
print(____)