Controleer afmetingsmetingen
Tot nu toe heb je 2 gevallen verwijderd met een abalonehoogte van 0 mm die onjuist gemeten waren. Je hebt ook 4 gevallen verwijderd waarbij shuckedWeight groter was dan wholeWeight, wat onlogisch is en waarschijnlijk komt door invoerfouten. De abaloneKeep-gegevensset die voor deze oefening is geladen, heeft nu alleen nog 4177 - 2 - 4 = 4171 gevallen.
Daarnaast moet je ook de relatie tussen de afmetingen controleren. De length van de abalones (in mm) is gedefinieerd als de langste schelplengte. Dus length hoort altijd groter te zijn dan height of diameter. Nu ga je deze voorwaarde controleren met een spreidingsdiagram met een Y=X-referentielijn. Daarna verwijder je alle gevallen die niet voldoen aan deze length-voorwaarde.
De abaloneKeep-gegevensset en de pakketten dplyr en ggplot2 zijn ook voor je geladen.
Deze oefening maakt deel uit van de cursus
R voor SAS-gebruikers
Oefeninstructies
- Maak een spreidingsdiagram met
lengthop de x-as enheightop de y-as en voeg de Y=X-referentielijn toe met intercept 0 en helling 1. - Maak een spreidingsdiagram met
lengthop de x-as endiameterop de y-as en voeg de Y=X-referentielijn toe met intercept 0 en helling 1. - Werk
abaloneKeepbij zodat je alleen abalones behoudt waarbijlengthgroter is dan zowelheightalsdiameter.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Make scatterplot of height by length add y=x line
ggplot(___) +
___ +
___
# Make scatterplot of diameter by length add y=x line
ggplot(___) +
___ +
___
# Keep abalones with length > both height and diameter
abaloneKeep <- abaloneKeep %>%
filter((___) & (___))