Auf fehlende Werte prüfen
Das Erkennen fehlender Werte ist wichtig für die Analyse. Mit demselben Datensatz ermittelst du die Gesamtanzahl fehlender Werte, indem du sowohl über Zeilen als auch über Spalten im Datensatz iterierst. Wenn fehlende Werte vorliegen, brauchst du weitere Methoden, um diese zu behandeln, zum Beispiel den Imputer aus sklearn. Fehlende Werte müssen behandelt werden, sonst wird es schwierig, eine saubere CTR-Vorhersage durchzuführen.
Beispieldaten liegen als DataFrame df vor. pandas als pd steht in deinem Workspace ebenfalls zur Verfügung.
Diese Übung ist Teil des Kurses
CTR-Vorhersage mit Machine Learning in Python
Anleitung zur Übung
- Gib eine einfache Zusammenfassung der Spalten mit
.info()aus. - Gib die fehlenden Werte je Spalte mit
.isnull()aus (denk an die Klammern!). - Gib die Gesamtanzahl fehlender Werte je Zeile mit
axis = 1und.sum()aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print info
print(df.____)
# Print missing values by column
print(df.____.sum(____ = 0))
# Print total number of missing values in rows
print(df.____.sum(____ = 1).____)