Substituindo rating pela mediana do grupo
No último exercício, você substituiu os valores ausentes na coluna rating pela mediana da própria coluna. Mas dá para fazer melhor? Dá sim! Você pode substituir os valores ausentes pela mediana das avaliações de chocolates da mesma empresa. Vamos lá!
Existe uma função replace_missing() pré-definida que recebe dois argumentos — um DataFrame group e uma coluna col. Ela tenta calcular a mediana da coluna col e a retorna se for bem-sucedida. Se o cálculo da mediana falhar, por exemplo, porque não há valores, ela retorna um valor predefinido.
O conjunto de dados chocolates e os pacotes DataFrames e Statistics já foram carregados para você.
Este exercício faz parte do curso
Manipulação de Dados em Julia
Instruções do exercício
- Agrupe
chocolatesporcompanye itere sobre o GroupedDataFrame. - Faça um subconjunto de cada grupo usando
ismissing()na colunarating, substituindo os valores ausentes pelo valor retornado pela funçãoreplace_missing().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Group by company and iterate
for group in ____(____)
# Subset each group using ismissing() and the rating column, assign a new value
group[____, ____] .= replace_missing(group, :rating)
end
println(describe(chocolates, :nmissing))