Calcular el vector de medias
El primer paso para analizar datos multivariantes es calcular el vector de medias. El conjunto de datos wine contiene varias variables. Vas a calcular el vector de medias de las cuatro primeras variables numéricas, Alcohol, Malic, Ash, Alcalinity, que están en las columnas de la 2 a la 5. Cuando las observaciones de un conjunto de datos pertenecen a subgrupos distintos, como el tipo de vino, también es útil calcular el vector de medias por grupo.
Este ejercicio forma parte del curso
Distribuciones de probabilidad multivariantes en R
Instrucciones del ejercicio
- Calcula la media de las cuatro primeras variables numéricas, que aparecen en las columnas
2:5, usando la funcióncolMeans(). - Calcula la media de esas variables para cada tipo de vino usando la función
by().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Calculate the mean of the Alcohol, Malic, Ash, and Alcalinity variables
colMeans(wine[___])
# Calculate the mean of the variables by wine type
by(wine[___], wine$___, colMeans)