Duplikate entfernen
Das Entfernen von Duplikaten ist wichtig, um genaue Zählungen zu erhalten, denn oft willst du dieselben Dinge nicht mehrmals zählen. In dieser Übung erstellst du einige neue DataFrames mit eindeutigen Werten aus sales.
sales ist verfügbar und pandas als pd importiert.
Diese Übung ist Teil des Kurses
Datenbearbeitung mit pandas
Anleitung zur Übung
- Entferne Zeilen mit doppelten Paaren von
storeundtypeaussales, speichere das Ergebnis alsstore_typesund gib den Kopf aus. - Entferne Zeilen mit doppelten Paaren von
storeunddepartmentaussales, speichere das Ergebnis alsstore_deptsund gib den Kopf aus. - Wähle anhand der Spalte
is_holidaydie Zeilen aus, die Feiertagswochen sind, lösche Einträge mit doppelten Datumswerten (date) und speichere das Ergebnis alsholiday_dates. - Wähle die Spalte
datevonholiday_datesaus und gib sie aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())
# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())
# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)
# Print date col of holiday_dates
print(____)