LoslegenKostenlos loslegen

Duplikate entfernen

Das Entfernen von Duplikaten ist wichtig, um genaue Zählungen zu erhalten, denn oft willst du dieselben Dinge nicht mehrmals zählen. In dieser Übung erstellst du einige neue DataFrames mit eindeutigen Werten aus sales.

sales ist verfügbar und pandas als pd importiert.

Diese Übung ist Teil des Kurses

Datenbearbeitung mit pandas

Kurs anzeigen

Anleitung zur Übung

  • Entferne Zeilen mit doppelten Paaren von store und type aus sales, speichere das Ergebnis als store_types und gib den Kopf aus.
  • Entferne Zeilen mit doppelten Paaren von store und department aus sales, speichere das Ergebnis als store_depts und gib den Kopf aus.
  • Wähle anhand der Spalte is_holiday die Zeilen aus, die Feiertagswochen sind, lösche Einträge mit doppelten Datumswerten (date) und speichere das Ergebnis als holiday_dates.
  • Wähle die Spalte date von holiday_dates aus und gib sie aus.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())

# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())

# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)

# Print date col of holiday_dates
print(____)
Code bearbeiten und ausführen