Bereinige deinen Datensatz
Reale Datensätze wie der Herzkrankheits-Datensatz sind oft unordentlich und enthalten doppelte oder fehlende Werte. In dieser Übung wendest du das Gelernte aus diesem Kapitel an, um den Herzkrankheits-Datensatz zu bereinigen. Der Datensatz wurde bereits für dich geladen. Deine Aufgabe ist es, auf Basis der EDA-Ergebnisse allgemeine Bereinigungsschritte durchzuführen: leere Spalten entfernen, doppelte Zeilen löschen und eine Imputation in der Spalte restecg vornehmen, die eine Elektrokardiogramm-Messung enthält. Pandas wurde als pd importiert, und der Herzkrankheits-Datensatz ist als pandas DataFrame namens heart_disease_df gespeichert.
Diese Übung ist Teil des Kurses
End-to-End Machine Learning
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Drop empty columns
heart_disease_column_dropped = heart_disease_df.____(____, ____)