Reemplazar rating con la mediana del grupo
En el ejercicio anterior, reemplazaste los valores ausentes de la columna rating por la mediana de la columna. Pero ¿se puede mejorar? ¡Sí! Puedes reemplazar los valores ausentes por la mediana de rating de los chocolates de la misma empresa. ¡Vamos a ello!
Hay una función predefinida replace_missing() que recibe dos argumentos: un DataFrame group y una columna col. Intenta calcular la mediana de la columna col y la devuelve si tiene éxito. Si calcular la mediana falla, por ejemplo, porque no hay valores, entonces devuelve un valor predefinido.
El conjunto de datos chocolates y los paquetes DataFrames y Statistics ya están cargados.
Este ejercicio forma parte del curso
Manipulación de datos en Julia
Instrucciones del ejercicio
- Agrupa
chocolatesporcompanye itera sobre el GroupedDataFrame. - Filtra cada grupo usando
ismissing()y la columnarating, reemplazando los valores ausentes por el valor de la funciónreplace_missing().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Group by company and iterate
for group in ____(____)
# Subset each group using ismissing() and the rating column, assign a new value
group[____, ____] .= replace_missing(group, :rating)
end
println(describe(chocolates, :nmissing))