Estadísticos específicos para una o más variables
Como viste antes, puedes usar funciones como summary(), psych::describe() o Hmisc::describe() para obtener muchos estadísticos descriptivos de una vez para una o varias variables de un conjunto de datos. También has calculado estadísticos individuales en ejercicios anteriores con funciones como mean(), median(), sd() y otras.
Sin embargo, el paquete dplyr ofrece la función summarise() sola o añadiendo la sintaxis across(everything(), list()) para calcular a la vez varios estadísticos personalizados de interés para una o varias variables.
El conjunto de datos abaloneKeep y el paquete dplyr ya están cargados para ti.
Este ejercicio forma parte del curso
R para usuarios de SAS
Instrucciones del ejercicio
- Obtén estadísticas de resumen para shucked weight y whole weight del conjunto de datos
abaloneKeepusandosummary(). - Obtén la media y la desviación estándar de length usando la función
summarise()del paquetedplyr. Nombra los estadísticos de salidamean_lengthysd_lengthpara la media y la desviación estándar, respectivamente. - Obtén la media y la desviación estándar de height y diameter usando la sintaxis
summarise(across(everything(), list()))del paquetedplyr.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Run summary() for shuckedWeight and wholeWeight
abaloneKeep %>%
select(___, ___) %>%
___
# Get mean and sd for length
abaloneKeep %>%
___(___ = mean(___),
___ = sd(___))
# Get mean and sd for height and diameter
abaloneKeep %>%
___ %>%
summarise(across(everything(),list(___ = ~ mean(.x),
___ = ~ sd(.x))))