Menghapus duplikat
Menghapus duplikat adalah keterampilan penting untuk memperoleh hitungan yang akurat karena sering kali Anda tidak ingin menghitung hal yang sama berulang kali. Pada latihan ini, Anda akan membuat beberapa DataFrame baru menggunakan nilai unik dari sales.
tersedia sales dan pandas telah diimpor sebagai pd.
Latihan ini adalah bagian dari kursus
Manipulasi Data dengan pandas
Petunjuk latihan
- Hapus baris
salesdengan pasangan duplikatstoredantype, simpan sebagaistore_types, lalu cetak head-nya. - Hapus baris
salesdengan pasangan duplikatstoredandepartment, simpan sebagaistore_depts, lalu cetak head-nya. - Melakukan subset pada baris yang merupakan minggu libur menggunakan kolom
is_holiday, lalu hapusdateyang duplikat, simpan sebagaiholiday_dates. - Pilih kolom
datedariholiday_dates, lalu cetak.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())
# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())
# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)
# Print date col of holiday_dates
print(____)