Aan de slagGa gratis aan de slag

De twee helften van je gegevensset vergelijken

Net zoals je de kenmerken van je volledige gegevensset hebt bekeken, is het belangrijk om na het splitsen ook de helften te onderzoeken. Je kunt altijd describe() op elke gegevensset gebruiken, maar het psych-pakket biedt ook functies om een gegevensset te vergelijken op basis van een groeperingsvariabele.

In deze oefening gebruik je de indexen die zijn aangemaakt bij het splitsen van de gegevens om een groeperingsvariabele te maken en die te koppelen aan de gcbs-gegevensset. Zodra die groeperingsvariabele is ingesteld, kun je met describeBy() en statsBy() zowel basisbeschrijvende statistieken als statistieken tussen groepen bekijken.

Een waarschuwing: de group-argumenten verschillen. Bij describeBy() moet group een vector zijn, terwijl bij statsBy() group juist de naam van een kolom in je dataframe moet zijn. Houd daar rekening mee!

Deze oefening maakt deel uit van de cursus

Factoranalyse in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Use the indices from the previous exercise to create a grouping variable
group_var <- vector("numeric", nrow(gcbs))
group_var[___] <- 1
group_var[___] <- 2
Code bewerken en uitvoeren