ComeçarComece de graça

Substituindo rating pela mediana do grupo

No último exercício, você substituiu os valores ausentes na coluna rating pela mediana da própria coluna. Mas dá para fazer melhor? Dá sim! Você pode substituir os valores ausentes pela mediana das avaliações de chocolates da mesma empresa. Vamos lá!

Existe uma função replace_missing() pré-definida que recebe dois argumentos — um DataFrame group e uma coluna col. Ela tenta calcular a mediana da coluna col e a retorna se for bem-sucedida. Se o cálculo da mediana falhar, por exemplo, porque não há valores, ela retorna um valor predefinido.

O conjunto de dados chocolates e os pacotes DataFrames e Statistics já foram carregados para você.

Este exercício faz parte do curso

Manipulação de Dados em Julia

Ver curso

Instruções do exercício

  • Agrupe chocolates por company e itere sobre o GroupedDataFrame.
  • Faça um subconjunto de cada grupo usando ismissing() na coluna rating, substituindo os valores ausentes pelo valor retornado pela função replace_missing().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Group by company and iterate
for group in ____(____)

	# Subset each group using ismissing() and the rating column, assign a new value 
	group[____, ____] .= replace_missing(group, :rating)
end

println(describe(chocolates, :nmissing))
Editar e executar o código