Verifica delle misure dimensionali
Finora hai rimosso 2 casi con altezza delle abaloni pari a 0 mm, misurate in modo errato. Hai anche rimosso 4 casi in cui shuckedWeight era maggiore di wholeWeight, cosa illogica probabilmente dovuta a errori di registrazione. Il dataset abaloneKeep caricato per questo esercizio ora ha solo 4177 - 2 - 4 = 4171 casi.
Inoltre, va esaminata anche la relazione tra le misure dimensionali. La length delle abaloni (in mm) è definita come la misura massima del guscio. Quindi length dovrebbe essere sempre maggiore di height e di diameter. Adesso verificherai questa condizione usando uno scatterplot con una retta di riferimento Y=X. Poi rimuoverai tutti i casi che non rispettano questa condizione su length.
Il dataset abaloneKeep e i pacchetti dplyr e ggplot2 sono già caricati per te.
Questo esercizio fa parte del corso
R per utenti SAS
Istruzioni dell'esercizio
- Crea uno scatterplot con
lengthsull'asse x eheightsull'asse y e aggiungi la retta di riferimento Y=X con intercetta 0 e pendenza 1. - Crea uno scatterplot con
lengthsull'asse x ediametersull'asse y e aggiungi la retta di riferimento Y=X con intercetta 0 e pendenza 1. - Aggiorna
abaloneKeepper mantenere le abaloni conlengthmaggiore sia diheightsia didiameter.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Make scatterplot of height by length add y=x line
ggplot(___) +
___ +
___
# Make scatterplot of diameter by length add y=x line
ggplot(___) +
___ +
___
# Keep abalones with length > both height and diameter
abaloneKeep <- abaloneKeep %>%
filter((___) & (___))