Aan de slagGa gratis aan de slag

Duplicaten verwijderen

Duplicaten verwijderen is een essentiële vaardigheid om correcte tellingen te krijgen, want vaak wil je hetzelfde item niet meerdere keren meetellen. In deze oefening maak je een paar nieuwe DataFrames met unieke waarden uit sales.

sales is beschikbaar en pandas is geïmporteerd als pd.

Deze oefening maakt deel uit van de cursus

Datamanipulatie met pandas

Cursus bekijken

Oefeninstructies

  • Verwijder rijen uit sales met dubbele paren van store en type, sla op als store_types en print de head.
  • Verwijder rijen uit sales met dubbele paren van store en department, sla op als store_depts en print de head.
  • Selecteer de rijen die vakantieweken zijn met de kolom is_holiday, en verwijder de dubbele datums. Sla dit op als holiday_dates.
  • Selecteer de kolom date van holiday_dates en print.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())

# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())

# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)

# Print date col of holiday_dates
print(____)
Code bewerken en uitvoeren