Eliminar los datos que faltan
En los próximos tres ejercicios, vas a ordenar el conjunto de datos music_df
. Crearás una canalización para imputar valores perdidos y construir un modelo clasificador KNN, y luego lo utilizarás para predecir si una canción es del género "Rock"
.
En este ejercicio en concreto, eliminarás los valores perdidos que representen menos del 5 % del conjunto de datos, y convertirás la columna "genre"
en una característica binaria.
Este ejercicio forma parte del curso
Aprendizaje supervisado con scikit-learn
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Print missing values for each column
____