Eliminazione dei duplicati
Rimuovere i duplicati è fondamentale per ottenere un conteggio preciso, perché spesso non vuoi considerare la stessa voce più volte. In questo esercizio creerai nuovi DataFrame utilizzando i valori univoci di sales
.
sales
è a tua disposizione e pandas
è già stato importato come pd
.
Questo esercizio fa parte del corso
Manipolazione dei dati con pandas
Istruzioni dell'esercizio
- Elimina da
sales
le righe con coppie duplicate distore
etype
, salva il risultato comestore_types
e stampa le prime righe. - Elimina da
sales
le righe con coppie duplicate distore
edepartment
, salva il risultato comestore_depts
e stampa le prime righe. - Seleziona le righe che sono settimane festive usando la colonna
is_holiday
ed elimina i duplicati didate
, salvando il risultato comeholiday_dates
". - Seleziona la colonna
date
diholiday_dates
e stampa.
Esercizio pratico interattivo
Prova questo esercizio completando il codice di esempio.
# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())
# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())
# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)
# Print date col of holiday_dates
print(____)