Eliminação de valores duplicados
A remoção de valores duplicados é uma habilidade essencial para obter contagens precisas porque, muitas vezes, não desejamos contar a mesma coisa várias vezes. Neste exercício, você criará alguns DataFrames novos usando valores únicos de sales
.
sales
já está disponível e pandas
foi importado como pd
.
Este exercício faz parte do curso
Manipulação de dados com o pandas
Instruções de exercício
- Remova as linhas de
sales
com pares duplicados destore
etype
, salve comostore_types
e imprima a parte superior. - Remova as linhas de
sales
com pares duplicados destore
edepartment
, salve comostore_depts
e imprima a parte superior. - Crie um subconjunto das linhas que são semanas com feriado usando a coluna
is_holiday
e elimine as datas (date
) duplicadas, salvando o resultado comoholiday_dates
. - Selecione a coluna
date
deholiday_dates
e imprima.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())
# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())
# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)
# Print date col of holiday_dates
print(____)