ComeçarComece de graça

Modelagem em data frames aninhados

Você vai trabalhar com o conjunto de dados de medidas corporais do US Army ANSUR II, que já foi pré-carregado como ansur_df. O objetivo é aninhar os dados por sexo para treinar, ao mesmo tempo, dois modelos lineares, um para cada sexo. Esses modelos vão estimar o peso de uma pessoa a partir de sua estatura (altura) e circunferência da cintura. Em seguida, você vai desaninhar os dados para inspecionar as estatísticas do modelo produzidas pela função glance() do pacote broom.

Os pacotes dplyr, broom e purrr já estão pré-carregados para você.

Observação: No código fornecido, a função map() do pacote purrr aplica funções a cada data frame aninhado. Dê uma olhada nesse pacote se você gosta de usar funções dentro de pipes!

Este exercício faz parte do curso

Reestruturando dados com tidyr

Ver curso

Instruções do exercício

  • Agrupe os dados por sex.
  • Aninhe os dados.
  • Desaninhe a coluna glanced.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

ansur_df %>%
  # Group the data by sex
  ___ %>% 
  # Nest the data
  ___ %>% 
  mutate(
    fit = map(data, function(df) lm(weight_kg ~ waist_circum_m + stature_m, data = df)),
    glanced = map(fit, glance)
  ) %>% 
  # Unnest the glanced column
  ___
Editar e executar o código