IniziaInizia gratis

Eliminazione dei duplicati

Rimuovere i duplicati è fondamentale per ottenere un conteggio preciso, perché spesso non vuoi considerare la stessa voce più volte. In questo esercizio creerai nuovi DataFrame utilizzando i valori univoci di sales.

sales è a tua disposizione e pandas è già stato importato come pd.

Questo esercizio fa parte del corso

Manipolazione dei dati con pandas

Visualizza il corso

Istruzioni dell'esercizio

  • Elimina da sales le righe con coppie duplicate di store e type, salva il risultato come store_types e stampa le prime righe.
  • Elimina da sales le righe con coppie duplicate di store e department, salva il risultato come store_depts e stampa le prime righe.
  • Seleziona le righe che sono settimane festive usando la colonna is_holiday ed elimina i duplicati di date, salvando il risultato come holiday_dates".
  • Seleziona la colonna date di holiday_dates e stampa.

Esercizio pratico interattivo

Prova questo esercizio completando il codice di esempio.

# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())

# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())

# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)

# Print date col of holiday_dates
print(____)
Modifica ed esegui il codice