Duplicaten verwijderen
Duplicaten verwijderen is een essentiële vaardigheid om correcte tellingen te krijgen, want vaak wil je hetzelfde item niet meerdere keren meetellen. In deze oefening maak je een paar nieuwe DataFrames met unieke waarden uit sales.
sales is beschikbaar en pandas is geïmporteerd als pd.
Deze oefening maakt deel uit van de cursus
Datamanipulatie met pandas
Oefeninstructies
- Verwijder rijen uit
salesmet dubbele paren vanstoreentype, sla op alsstore_typesen print de head. - Verwijder rijen uit
salesmet dubbele paren vanstoreendepartment, sla op alsstore_deptsen print de head. - Selecteer de rijen die vakantieweken zijn met de kolom
is_holiday, en verwijder de dubbele datums. Sla dit op alsholiday_dates. - Selecteer de kolom
datevanholiday_datesen print.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())
# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())
# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)
# Print date col of holiday_dates
print(____)