Eliminação de valores duplicados
A remoção de valores duplicados é uma habilidade essencial para obter contagens precisas porque, muitas vezes, não desejamos contar a mesma coisa várias vezes. Neste exercício, você criará alguns DataFrames novos usando valores únicos de sales.
sales já está disponível e pandas foi importado como pd.
Este exercício faz parte do curso
Manipulação de dados com o pandas
Instruções do exercício
- Remova as linhas de
salescom pares duplicados destoreetype, salve comostore_typese imprima a parte superior. - Remova as linhas de
salescom pares duplicados destoreedepartment, salve comostore_deptse imprima a parte superior. - Crie um subconjunto das linhas que são semanas com feriado usando a coluna
is_holidaye elimine as datas (date) duplicadas, salvando o resultado comoholiday_dates. - Selecione a coluna
datedeholiday_datese imprima.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Drop duplicate store/type combinations
store_types = ____
print(store_types.head())
# Drop duplicate store/department combinations
store_depts = ____
print(store_depts.head())
# Subset the rows where is_holiday is True and drop duplicate dates
holiday_dates = sales[sales[____]].drop_duplicates(____)
# Print date col of holiday_dates
print(____)