Eliminazione dei duplicati
Rimuovere i duplicati è fondamentale per ottenere un conteggio preciso, perché spesso non vuoi considerare la stessa voce più volte. In questo esercizio creerai nuovi DataFrame utilizzando i valori univoci di sales.
sales è a tua disposizione e pandas è già stato importato come pd.
Questo esercizio fa parte del corso
Manipolazione dei dati con pandas
Istruzioni dell'esercizio
- Elimina da
salesle righe con coppie duplicate distoreetype, salva il risultato comestore_typese stampa le prime righe. - Elimina da
salesle righe con coppie duplicate distoreedepartment, salva il risultato comestore_deptse stampa le prime righe. - Seleziona le righe che sono settimane festive usando la colonna
is_holidayed elimina i duplicati didate, salvando il risultato comeholiday_dates". - Seleziona la colonna
datediholiday_datese stampa.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())
# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())
# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)
# Print date col of holiday_dates
print(____)