Aan de slagGa gratis aan de slag

Controleer afmetingsmetingen

Tot nu toe heb je 2 gevallen verwijderd met een abalonehoogte van 0 mm die onjuist gemeten waren. Je hebt ook 4 gevallen verwijderd waarbij shuckedWeight groter was dan wholeWeight, wat onlogisch is en waarschijnlijk komt door invoerfouten. De abaloneKeep-gegevensset die voor deze oefening is geladen, heeft nu alleen nog 4177 - 2 - 4 = 4171 gevallen.

Daarnaast moet je ook de relatie tussen de afmetingen controleren. De length van de abalones (in mm) is gedefinieerd als de langste schelplengte. Dus length hoort altijd groter te zijn dan height of diameter. Nu ga je deze voorwaarde controleren met een spreidingsdiagram met een Y=X-referentielijn. Daarna verwijder je alle gevallen die niet voldoen aan deze length-voorwaarde.

De abaloneKeep-gegevensset en de pakketten dplyr en ggplot2 zijn ook voor je geladen.

Deze oefening maakt deel uit van de cursus

R voor SAS-gebruikers

Cursus bekijken

Oefeninstructies

  • Maak een spreidingsdiagram met length op de x-as en height op de y-as en voeg de Y=X-referentielijn toe met intercept 0 en helling 1.
  • Maak een spreidingsdiagram met length op de x-as en diameter op de y-as en voeg de Y=X-referentielijn toe met intercept 0 en helling 1.
  • Werk abaloneKeep bij zodat je alleen abalones behoudt waarbij length groter is dan zowel height als diameter.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Make scatterplot of height by length add y=x line
ggplot(___) +
  ___ + 
  ___

# Make scatterplot of diameter by length add y=x line
ggplot(___) +
  ___ + 
  ___

# Keep abalones with length > both height and diameter
abaloneKeep <- abaloneKeep %>%
  filter((___) & (___))
Code bewerken en uitvoeren