Missende gegevens verwijderen
In de komende drie oefeningen ga je de music_df-gegevensset opschonen. Je bouwt een pipeline om missende waarden in te vullen en maakt een KNN-classificatiemodel, dat je vervolgens gebruikt om te voorspellen of een nummer het genre "Rock" heeft.
In deze oefening verwijder je specifiek missende waarden die minder dan 5% van de gegevensset uitmaken, en zet je de kolom "genre" om naar een binaire feature.
Deze oefening maakt deel uit van de cursus
Supervised Learning met scikit-learn
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print missing values for each column
____