1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Manipulacja danymi z pandas

Connected

Exercise

Usuwanie duplikatów

Usuwanie duplikatów to kluczowa umiejętność, która pozwala uzyskać dokładne liczniki – zazwyczaj nie chcesz zliczać tych samych danych wielokrotnie. W tym ćwiczeniu utworzysz nowe DataFrames, korzystając z unikatowych wartości ze zbioru sales.

sales jest dostępny, a pandas zaimportowany jako pd.

Instrukcje

100 XP
  • Usuń wiersze z sales, w których pary wartości store i type się powtarzają, zapisz wynik jako store_types i wyświetl jego początek.
  • Usuń wiersze z sales, w których pary wartości store i department się powtarzają, zapisz wynik jako store_depts i wyświetl jego początek.
  • Wybierz wiersze odpowiadające tygodniom świątecznym za pomocą kolumny is_holiday, a następnie usuń zduplikowane wartości date i zapisz wynik jako holiday_dates.
  • Wybierz kolumnę date z holiday_dates i wyświetl jej zawartość.