Calcolare il vettore delle medie
Il primo passo per analizzare dati multivariati è calcolare il vettore delle medie. Il dataset wine comprende diverse variabili. Calcolerai il vettore delle medie delle prime quattro variabili numeriche, Alcohol, Malic, Ash, Alcalinity, che si trovano nelle colonne dalla 2 alla 5. Quando le osservazioni in un insieme di dati hanno sottogruppi diversi, come il tipo di vino, è utile anche calcolare il vettore delle medie per gruppo.
Questo esercizio fa parte del corso
Distribuzioni di probabilità multivariate in R
Istruzioni dell'esercizio
- Calcola la media delle prime quattro variabili numeriche, che compaiono nelle colonne
2:5, usando la funzionecolMeans(). - Calcola la media delle variabili sopra per ciascun tipo di vino, usando la funzione
by().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Calculate the mean of the Alcohol, Malic, Ash, and Alcalinity variables
colMeans(wine[___])
# Calculate the mean of the variables by wine type
by(wine[___], wine$___, colMeans)