Modelagem em data frames aninhados
Você vai trabalhar com o conjunto de dados de medidas corporais do US Army ANSUR II, que já foi pré-carregado como ansur_df. O objetivo é aninhar os dados por sexo para treinar, ao mesmo tempo, dois modelos lineares, um para cada sexo. Esses modelos vão estimar o peso de uma pessoa a partir de sua estatura (altura) e circunferência da cintura. Em seguida, você vai desaninhar os dados para inspecionar as estatísticas do modelo produzidas pela função glance() do pacote broom.
Os pacotes dplyr, broom e purrr já estão pré-carregados para você.
Observação: No código fornecido, a função map() do pacote purrr aplica funções a cada data frame aninhado. Dê uma olhada nesse pacote se você gosta de usar funções dentro de pipes!
Este exercício faz parte do curso
Reestruturando dados com tidyr
Instruções do exercício
- Agrupe os dados por
sex. - Aninhe os dados.
- Desaninhe a coluna
glanced.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
ansur_df %>%
# Group the data by sex
___ %>%
# Nest the data
___ %>%
mutate(
fit = map(data, function(df) lm(weight_kg ~ waist_circum_m + stature_m, data = df)),
glanced = map(fit, glance)
) %>%
# Unnest the glanced column
___