Verwerfen von fehlenden Daten
In den nächsten drei Übungen bereinigst du den Datensatz music_df
. Du erstellst eine Pipeline, um fehlende Werte zu ergänzen, und ein KNN-Klassifikationsmodell, mit dem du dann vorhersagen kannst, ob ein Song dem Genre "Rock"
angehört.
In dieser Übung verwirfst du fehlende Werte, die weniger als 5 % des Datensatzes ausmachen. Zudem wandelst du die Spalte "genre"
in ein binäres Merkmal um.
Diese Übung ist Teil des Kurses
Überwachtes Lernen mit scikit-learn
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Print missing values for each column
____