Aan de slagGa gratis aan de slag

De gemiddeldevector berekenen

De eerste stap bij het analyseren van multivariate data is het berekenen van de gemiddeldevector. De wine-gegevensset bestaat uit meerdere variabelen. Je gaat de gemiddeldevector berekenen van de eerste vier numerieke variabelen, Alcohol, Malic, Ash, Alcalinity, die in kolommen 2 tot en met 5 staan. Als waarnemingen in een gegevensset verschillende subgroepen hebben, zoals wijntype, is het ook handig om de gemiddeldevector per groep te berekenen.

Deze oefening maakt deel uit van de cursus

Multivariate kansverdelingen in R

Cursus bekijken

Oefeninstructies

  • Bereken het gemiddelde van de eerste vier numerieke variabelen in kolommen 2:5 met de functie colMeans().
  • Bereken het gemiddelde van bovenstaande variabelen voor elk wijntype met de functie by().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Calculate the mean of the Alcohol, Malic, Ash, and Alcalinity variables 
colMeans(wine[___])

# Calculate the mean of the variables by wine type
by(wine[___], wine$___, colMeans)
Code bewerken en uitvoeren