ComeçarComece gratuitamente

Eliminação de valores duplicados

A remoção de valores duplicados é uma habilidade essencial para obter contagens precisas porque, muitas vezes, não desejamos contar a mesma coisa várias vezes. Neste exercício, você criará alguns DataFrames novos usando valores únicos de sales.

sales já está disponível e pandas foi importado como pd.

Este exercício faz parte do curso

Manipulação de dados com o pandas

Ver Curso

Instruções de exercício

  • Remova as linhas de sales com pares duplicados de store e type, salve como store_types e imprima a parte superior.
  • Remova as linhas de sales com pares duplicados de store e department, salve como store_depts e imprima a parte superior.
  • Crie um subconjunto das linhas que são semanas com feriado usando a coluna is_holiday e elimine as datas (date) duplicadas, salvando o resultado como holiday_dates.
  • Selecione a coluna date de holiday_dates e imprima.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())

# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())

# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)

# Print date col of holiday_dates
print(____)
Editar e executar código