Duplikate entfernen
Das Entfernen von Duplikaten ist wichtig, um genaue Zählungen zu erhalten, denn oft willst du dieselben Dinge nicht mehrmals zählen. In dieser Übung erstellst du einige neue DataFrames mit eindeutigen Werten aus sales.
sales ist verfügbar und pandas als pd importiert.
Diese Übung ist Teil des Kurses
<Kurs>Datenbearbeitung mit pandas</Kurs>Übungsanweisungen
- Entferne Zeilen mit doppelten Paaren von
storeundtypeaussales, speichere das Ergebnis alsstore_typesund gib den Kopf aus. - Entferne Zeilen mit doppelten Paaren von
storeunddepartmentaussales, speichere das Ergebnis alsstore_deptsund gib den Kopf aus. - Wähle anhand der Spalte
is_holidaydie Zeilen aus, die Feiertagswochen sind, lösche Einträge mit doppelten Datumswerten (date) und speichere das Ergebnis alsholiday_dates. - Wähle die Spalte
datevonholiday_datesaus und gib sie aus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())
# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())
# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)
# Print date col of holiday_dates
print(____)