Sostituire rating con la mediana del gruppo
Nell'ultimo esercizio hai sostituito i valori mancanti nella colonna rating con la mediana della colonna. Ma si può fare di meglio? Certo! Puoi sostituire i valori mancanti con la mediana dei rating dei cioccolati della stessa azienda. Facciamolo!
C'è una funzione predefinita replace_missing() che accetta due argomenti: un DataFrame group e una colonna col. Prova a calcolare la mediana della colonna col e la restituisce se ha successo. Se il calcolo della mediana fallisce, ad esempio perché non ci sono valori, allora restituisce un valore predefinito.
Il dataset chocolates e i pacchetti DataFrames e Statistics sono già stati caricati per te.
Questo esercizio fa parte del corso
Manipolazione dei dati in Julia
Istruzioni dell'esercizio
- Raggruppa
chocolatespercompanye itera sul GroupedDataFrame. - Sottinsiema ogni gruppo usando
ismissing()e la colonnarating, sostituendo i valori mancanti con il valore restituito dalla funzionereplace_missing().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Group by company and iterate
for group in ____(____)
# Subset each group using ismissing() and the rating column, assign a new value
group[____, ____] .= replace_missing(group, :rating)
end
println(describe(chocolates, :nmissing))