LoslegenKostenlos loslegen

Fehlende Werte erkennen

Der erste Schritt vor der Imputation fehlender Werte ist zu prüfen, ob es fehlende Werte in unseren Daten gibt und, falls ja, aus welcher Gruppe sie stammen.

Für die gleichen restaurant_data, die dir in der Lektion begegnet sind, hat ein Mitarbeiter versehentlich die Trinkgelder an 65 Tischen gelöscht. Die Frage ist, wie viele fehlende Einträge von Tischen stammen, an denen Raucher anwesend waren, im Vergleich zu Tischen ohne Raucher.

Deine Aufgabe ist es, beide Datensätze nach der Variable smoker zu gruppieren, die Anzahl der vorhandenen Werte zu zählen und dann die Differenz zu berechnen.

Wir imputieren hier Trinkgelder, damit du die in der Lektion vermittelten Konzepte üben kannst. Aus ethischer Sicht solltest du in der Realität keine Finanzdaten imputieren, da dies als Betrug gelten könnte.

Diese Übung ist Teil des Kurses

Effizient mit pandas programmieren

Kurs anzeigen

Anleitung zur Übung

  • Gruppiere die Daten nach Rauchstatus.
  • Berechne die Anzahl der nicht fehlenden Werte in jeder Gruppe.
  • Gib die Anzahl der fehlenden Werte in jeder Gruppe aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Group both objects according to smoke condition
restaurant_nan_grouped = restaurant_nan.____(____)

# Store the number of present values
restaurant_nan_nval = restaurant_nan_grouped['tip'].____()

# Print the group-wise missing entries
print(restaurant_nan_grouped['total_bill'].count() - ____)
Code bearbeiten und ausführen