Estatísticas específicas para uma ou mais variáveis
Como você viu antes, é possível usar funções como summary(), psych::describe() ou Hmisc::describe() para obter várias estatísticas descritivas de uma vez para uma ou mais variáveis em um conjunto de dados. Você também já calculou estatísticas individuais em exercícios anteriores usando funções como mean(), median(), sd() e outras.
No entanto, o pacote dplyr oferece a função summarise() sozinha ou combinada com a sintaxe across(everything(), list()) para calcular várias estatísticas personalizadas de interesse, juntas, para uma ou mais variables por vez.
O conjunto de dados abaloneKeep e o pacote dplyr já estão carregados para você.
Este exercício faz parte do curso
R para Usuários de SAS
Instruções do exercício
- Obtenha estatísticas de resumo para shucked weight e whole weight do conjunto de dados
abaloneKeepusandosummary(). - Obtenha a média e o desvio padrão de length usando a função
summarise()do pacotedplyr. Nomeie as estatísticas de saída comomean_lengthesd_lengthpara média e desvio padrão, respectivamente. - Obtenha a média e o desvio padrão de height e diameter usando a sintaxe
summarise(across(everything(), list()))do pacotedplyr.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Run summary() for shuckedWeight and wholeWeight
abaloneKeep %>%
select(___, ___) %>%
___
# Get mean and sd for length
abaloneKeep %>%
___(___ = mean(___),
___ = sd(___))
# Get mean and sd for height and diameter
abaloneKeep %>%
___ %>%
summarise(across(everything(),list(___ = ~ mean(.x),
___ = ~ sd(.x))))