ComenzarEmpieza gratis

Eliminar duplicados

Eliminar duplicados es una habilidad esencial para obtener recuentos precisos, porque a menudo no quieres contar lo mismo varias veces. En este ejercicio, crearás algunos DataFrames nuevos utilizando valores únicos de sales.

sales está disponible y pandas se importa como pd.

Este ejercicio forma parte del curso

Manipulación de datos con pandas

Ver curso

Instrucciones del ejercicio

  • Elimina las filas de sales con pares duplicados de store y type y guárdalas como store_types e imprime el encabezado.
  • Elimina las filas de sales con pares duplicados de store y department y guárdalas como store_depts e imprime el encabezado.
  • Subconjunta las filas que sean semanas de vacaciones utilizando la columna is_holiday y elimina las dates duplicadas, guardándolas como holiday_dates.
  • Selecciona la columna date de holiday_dates, e imprímela.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())

# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())

# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)

# Print date col of holiday_dates
print(____)
Editar y ejecutar código