Aan de slagGa gratis aan de slag

Beschrijvende statistiek en functiemasking

Eerder zag je dat de functie summary() het gemiddelde, de mediaan, het 1e en 3e kwartiel plus de min en max berekent. De standaarddeviatie zit daar niet bij. De packages Hmisc en psych hebben echter allebei een functie describe() die meer beschrijvende statistieken geeft, inclusief de standaarddeviatie.

Om deze beschrijvende statistieken te krijgen, ga je de functie describe() uitvoeren, die in beide packages dezelfde naam heeft. Om verwarring te voorkomen, is het verstandig altijd de notatie packagename::functionname() te gebruiken om expliciet de functie uit het gewenste package aan te roepen.

De gegevensset abaloneKeep en het package dplyr zijn al voor je geladen.

Deze oefening maakt deel uit van de cursus

R voor SAS-gebruikers

Cursus bekijken

Oefeninstructies

  • Laad het package Hmisc.
  • Haal beschrijvende statistieken op voor abalone sex, length, diameter en height met de functie Hmisc::describe().
  • Laad het package psych — let op de waarschuwingen over de functie describe() die wordt gemaskt vanuit het Hmisc-package (omdat beide packages een functie describe() hebben).
  • Voer de functie describe() uit uit het psych-package om beschrijvende statistieken te krijgen voor abalone length, diameter en height. Laat sex weg, want psych::describe() werkt alleen voor numerieke variabelen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load the Hmisc package
library(___)

# Run describe() from Hmisc for sex, length, diameter, height
abaloneKeep %>% 
  select(___, ___, ___, ___) %>% 
  ___::___

# Load the psych package
___

# Run describe() from psych for length, diameter, height
___ %>% 
  ___ %>% 
  ___::___
Code bewerken en uitvoeren