IniziaInizia gratis

Statistiche specifiche per una o più variabili

Come hai visto in precedenza, puoi usare funzioni come summary(), psych::describe() o Hmisc::describe() per ottenere molte statistiche descrittive in una volta sola per una o più variabili in un insieme di dati. Hai anche calcolato singole statistiche negli esercizi precedenti usando funzioni come mean(), median(), sd() e altre.

Tuttavia, il pacchetto dplyr mette a disposizione la funzione summarise() da sola o abbinata alla sintassi across(everything(), list()) per calcolare insieme più statistiche personalizzate di interesse per una o più variabili alla volta.

Il dataset abaloneKeep e il pacchetto dplyr sono già caricati per te.

Questo esercizio fa parte del corso

R per utenti SAS

Visualizza il corso

Istruzioni dell'esercizio

  • Calcola le statistiche riassuntive per shucked weight e whole weight dal dataset abaloneKeep usando summary().
  • Calcola media e deviazione standard di length usando la funzione summarise() del pacchetto dplyr. Assegna ai risultati i nomi mean_length e sd_length rispettivamente per media e deviazione standard.
  • Calcola media e deviazione standard di height e diameter usando la sintassi summarise(across(everything(), list())) del pacchetto dplyr.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Run summary() for shuckedWeight and wholeWeight
abaloneKeep %>%
  select(___, ___) %>%
  ___

# Get mean and sd for length
abaloneKeep %>%
  ___(___ = mean(___),
      ___ = sd(___))

# Get mean and sd for height and diameter
abaloneKeep %>%
  ___ %>%
  summarise(across(everything(),list(___ = ~ mean(.x),
                                     ___ = ~ sd(.x))))
Modifica ed esegui il codice