ComeçarComece de graça

Estatísticas específicas para uma ou mais variáveis

Como você viu antes, é possível usar funções como summary(), psych::describe() ou Hmisc::describe() para obter várias estatísticas descritivas de uma vez para uma ou mais variáveis em um conjunto de dados. Você também já calculou estatísticas individuais em exercícios anteriores usando funções como mean(), median(), sd() e outras.

No entanto, o pacote dplyr oferece a função summarise() sozinha ou combinada com a sintaxe across(everything(), list()) para calcular várias estatísticas personalizadas de interesse, juntas, para uma ou mais variables por vez.

O conjunto de dados abaloneKeep e o pacote dplyr já estão carregados para você.

Este exercício faz parte do curso

R para Usuários de SAS

Ver curso

Instruções do exercício

  • Obtenha estatísticas de resumo para shucked weight e whole weight do conjunto de dados abaloneKeep usando summary().
  • Obtenha a média e o desvio padrão de length usando a função summarise() do pacote dplyr. Nomeie as estatísticas de saída como mean_length e sd_length para média e desvio padrão, respectivamente.
  • Obtenha a média e o desvio padrão de height e diameter usando a sintaxe summarise(across(everything(), list())) do pacote dplyr.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Run summary() for shuckedWeight and wholeWeight
abaloneKeep %>%
  select(___, ___) %>%
  ___

# Get mean and sd for length
abaloneKeep %>%
  ___(___ = mean(___),
      ___ = sd(___))

# Get mean and sd for height and diameter
abaloneKeep %>%
  ___ %>%
  summarise(across(everything(),list(___ = ~ mean(.x),
                                     ___ = ~ sd(.x))))
Editar e executar o código