Duplikate entfernen
Das Entfernen von Duplikaten ist wichtig, um genaue Zählungen zu erhalten, denn oft willst du dieselben Dinge nicht mehrmals zählen. In dieser Übung erstellst du einige neue DataFrames mit eindeutigen Werten aus sales
.
sales
ist verfügbar und pandas
als pd
importiert.
Diese Übung ist Teil des Kurses
Datenbearbeitung mit pandas
Anleitung zur Übung
- Entferne Zeilen mit doppelten Paaren von
store
undtype
aussales
, speichere das Ergebnis alsstore_types
und gib den Kopf aus. - Entferne Zeilen mit doppelten Paaren von
store
unddepartment
aussales
, speichere das Ergebnis alsstore_depts
und gib den Kopf aus. - Wähle anhand der Spalte
is_holiday
die Zeilen aus, die Feiertagswochen sind, lösche Einträge mit doppelten Datumswerten (date
) und speichere das Ergebnis alsholiday_dates
. - Wähle die Spalte
date
vonholiday_dates
aus und gib sie aus.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())
# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())
# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)
# Print date col of holiday_dates
print(____)