ComenzarEmpieza gratis

Estadísticos específicos para una o más variables

Como viste antes, puedes usar funciones como summary(), psych::describe() o Hmisc::describe() para obtener muchos estadísticos descriptivos de una vez para una o varias variables de un conjunto de datos. También has calculado estadísticos individuales en ejercicios anteriores con funciones como mean(), median(), sd() y otras.

Sin embargo, el paquete dplyr ofrece la función summarise() sola o añadiendo la sintaxis across(everything(), list()) para calcular a la vez varios estadísticos personalizados de interés para una o varias variables.

El conjunto de datos abaloneKeep y el paquete dplyr ya están cargados para ti.

Este ejercicio forma parte del curso

R para usuarios de SAS

Ver curso

Instrucciones del ejercicio

  • Obtén estadísticas de resumen para shucked weight y whole weight del conjunto de datos abaloneKeep usando summary().
  • Obtén la media y la desviación estándar de length usando la función summarise() del paquete dplyr. Nombra los estadísticos de salida mean_length y sd_length para la media y la desviación estándar, respectivamente.
  • Obtén la media y la desviación estándar de height y diameter usando la sintaxis summarise(across(everything(), list())) del paquete dplyr.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Run summary() for shuckedWeight and wholeWeight
abaloneKeep %>%
  select(___, ___) %>%
  ___

# Get mean and sd for length
abaloneKeep %>%
  ___(___ = mean(___),
      ___ = sd(___))

# Get mean and sd for height and diameter
abaloneKeep %>%
  ___ %>%
  summarise(across(everything(),list(___ = ~ mean(.x),
                                     ___ = ~ sd(.x))))
Editar y ejecutar código