Eliminar duplicados
Eliminar duplicados es una habilidad esencial para obtener recuentos precisos, porque a menudo no quieres contar lo mismo varias veces. En este ejercicio, crearás algunos DataFrames nuevos utilizando valores únicos de sales
.
sales
está disponible y pandas
se importa como pd
.
Este ejercicio forma parte del curso
Manipulación de datos con pandas
Instrucciones del ejercicio
- Elimina las filas de
sales
con pares duplicados destore
ytype
y guárdalas comostore_types
e imprime el encabezado. - Elimina las filas de
sales
con pares duplicados destore
ydepartment
y guárdalas comostore_depts
e imprime el encabezado. - Subconjunta las filas que sean semanas de vacaciones utilizando la columna
is_holiday
y elimina lasdate
s duplicadas, guardándolas comoholiday_dates
. - Selecciona la columna
date
deholiday_dates
, e imprímela.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())
# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())
# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)
# Print date col of holiday_dates
print(____)