Beschrijvende statistiek en functiemasking
Eerder zag je dat de functie summary() het gemiddelde, de mediaan, het 1e en 3e kwartiel plus de min en max berekent. De standaarddeviatie zit daar niet bij. De packages Hmisc en psych hebben echter allebei een functie describe() die meer beschrijvende statistieken geeft, inclusief de standaarddeviatie.
Om deze beschrijvende statistieken te krijgen, ga je de functie describe() uitvoeren, die in beide packages dezelfde naam heeft. Om verwarring te voorkomen, is het verstandig altijd de notatie packagename::functionname() te gebruiken om expliciet de functie uit het gewenste package aan te roepen.
De gegevensset abaloneKeep en het package dplyr zijn al voor je geladen.
Deze oefening maakt deel uit van de cursus
R voor SAS-gebruikers
Oefeninstructies
- Laad het package
Hmisc. - Haal beschrijvende statistieken op voor abalone sex, length, diameter en height met de functie
Hmisc::describe(). - Laad het package
psych— let op de waarschuwingen over de functiedescribe()die wordt gemaskt vanuit hetHmisc-package (omdat beide packages een functiedescribe()hebben). - Voer de functie
describe()uit uit hetpsych-package om beschrijvende statistieken te krijgen voor abalone length, diameter en height. Laat sex weg, wantpsych::describe()werkt alleen voor numerieke variabelen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the Hmisc package
library(___)
# Run describe() from Hmisc for sex, length, diameter, height
abaloneKeep %>%
select(___, ___, ___, ___) %>%
___::___
# Load the psych package
___
# Run describe() from psych for length, diameter, height
___ %>%
___ %>%
___::___