IniziaInizia gratis

Sostituire rating con la mediana del gruppo

Nell'ultimo esercizio hai sostituito i valori mancanti nella colonna rating con la mediana della colonna. Ma si può fare di meglio? Certo! Puoi sostituire i valori mancanti con la mediana dei rating dei cioccolati della stessa azienda. Facciamolo!

C'è una funzione predefinita replace_missing() che accetta due argomenti: un DataFrame group e una colonna col. Prova a calcolare la mediana della colonna col e la restituisce se ha successo. Se il calcolo della mediana fallisce, ad esempio perché non ci sono valori, allora restituisce un valore predefinito.

Il dataset chocolates e i pacchetti DataFrames e Statistics sono già stati caricati per te.

Questo esercizio fa parte del corso

Manipolazione dei dati in Julia

Visualizza il corso

Istruzioni dell'esercizio

  • Raggruppa chocolates per company e itera sul GroupedDataFrame.
  • Sottinsiema ogni gruppo usando ismissing() e la colonna rating, sostituendo i valori mancanti con il valore restituito dalla funzione replace_missing().

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Group by company and iterate
for group in ____(____)

	# Subset each group using ismissing() and the rating column, assign a new value 
	group[____, ____] .= replace_missing(group, :rating)
end

println(describe(chocolates, :nmissing))
Modifica ed esegui il codice