Eliminar duplicados
Eliminar duplicados es una habilidad esencial para obtener recuentos precisos, porque a menudo no quieres contar lo mismo varias veces. En este ejercicio, crearás algunos DataFrames nuevos utilizando valores únicos de sales.
sales está disponible y pandas se importa como pd.
Este ejercicio forma parte del curso
Manipulación de datos con pandas
Instrucciones del ejercicio
- Elimina las filas de
salescon pares duplicados destoreytypey guárdalas comostore_typese imprime el encabezado. - Elimina las filas de
salescon pares duplicados destoreydepartmenty guárdalas comostore_deptse imprime el encabezado. - Subconjunta las filas que sean semanas de vacaciones utilizando la columna
is_holidayy elimina lasdates duplicadas, guardándolas comoholiday_dates. - Selecciona la columna
datedeholiday_dates, e imprímela.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())
# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())
# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)
# Print date col of holiday_dates
print(____)