ComenzarEmpieza gratis

Reemplazar rating con la mediana del grupo

En el ejercicio anterior, reemplazaste los valores ausentes de la columna rating por la mediana de la columna. Pero ¿se puede mejorar? ¡Sí! Puedes reemplazar los valores ausentes por la mediana de rating de los chocolates de la misma empresa. ¡Vamos a ello!

Hay una función predefinida replace_missing() que recibe dos argumentos: un DataFrame group y una columna col. Intenta calcular la mediana de la columna col y la devuelve si tiene éxito. Si calcular la mediana falla, por ejemplo, porque no hay valores, entonces devuelve un valor predefinido.

El conjunto de datos chocolates y los paquetes DataFrames y Statistics ya están cargados.

Este ejercicio forma parte del curso

Manipulación de datos en Julia

Ver curso

Instrucciones del ejercicio

  • Agrupa chocolates por company e itera sobre el GroupedDataFrame.
  • Filtra cada grupo usando ismissing() y la columna rating, reemplazando los valores ausentes por el valor de la función replace_missing().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Group by company and iterate
for group in ____(____)

	# Subset each group using ismissing() and the rating column, assign a new value 
	group[____, ____] .= replace_missing(group, :rating)
end

println(describe(chocolates, :nmissing))
Editar y ejecutar código