Auf fehlende Werte prüfen
Das Erkennen fehlender Werte ist wichtig für die Analyse. Mit demselben Datensatz ermittelst du die Gesamtanzahl fehlender Werte, indem du sowohl über Zeilen als auch über Spalten im Datensatz iterierst. Wenn fehlende Werte vorliegen, brauchst du weitere Methoden, um diese zu behandeln, zum Beispiel den Imputer aus sklearn. Fehlende Werte müssen behandelt werden, sonst wird es schwierig, eine saubere CTR-Vorhersage durchzuführen.
Beispieldaten liegen als DataFrame df vor. pandas als pd steht in deinem Workspace ebenfalls zur Verfügung.
Diese Übung ist Teil des Kurses
<Kurs>CTR-Vorhersage mit Machine Learning in Python</Kurs>Übungsanweisungen
- Gib eine einfache Zusammenfassung der Spalten mit
.info()aus. - Gib die fehlenden Werte je Spalte mit
.isnull()aus (denk an die Klammern!). - Gib die Gesamtanzahl fehlender Werte je Zeile mit
axis = 1und.sum()aus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Print info
print(df.____)
# Print missing values by column
print(df.____.sum(____ = 0))
# Print total number of missing values in rows
print(df.____.sum(____ = 1).____)