Statistiche specifiche per una o più variabili
Come hai visto in precedenza, puoi usare funzioni come summary(), psych::describe() o Hmisc::describe() per ottenere molte statistiche descrittive in una volta sola per una o più variabili in un insieme di dati. Hai anche calcolato singole statistiche negli esercizi precedenti usando funzioni come mean(), median(), sd() e altre.
Tuttavia, il pacchetto dplyr mette a disposizione la funzione summarise() da sola o abbinata alla sintassi across(everything(), list()) per calcolare insieme più statistiche personalizzate di interesse per una o più variabili alla volta.
Il dataset abaloneKeep e il pacchetto dplyr sono già caricati per te.
Questo esercizio fa parte del corso
R per utenti SAS
Istruzioni dell'esercizio
- Calcola le statistiche riassuntive per shucked weight e whole weight dal dataset
abaloneKeepusandosummary(). - Calcola media e deviazione standard di length usando la funzione
summarise()del pacchettodplyr. Assegna ai risultati i nomimean_lengthesd_lengthrispettivamente per media e deviazione standard. - Calcola media e deviazione standard di height e diameter usando la sintassi
summarise(across(everything(), list()))del pacchettodplyr.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Run summary() for shuckedWeight and wholeWeight
abaloneKeep %>%
select(___, ___) %>%
___
# Get mean and sd for length
abaloneKeep %>%
___(___ = mean(___),
___ = sd(___))
# Get mean and sd for height and diameter
abaloneKeep %>%
___ %>%
summarise(across(everything(),list(___ = ~ mean(.x),
___ = ~ sd(.x))))