ComeçarComece de graça

Inferência com e sem outlier (randomização)

Usando o teste por randomização, você pode novamente avaliar o efeito de um outlier nas conclusões inferenciais de um modelo linear. Execute um teste de randomização nos dados hypdata_out duas vezes: uma com o valor discrepante e outra sem ele. Observe que as linhas de código estendidas deixam claros os passos dos testes de randomização.

Este exercício faz parte do curso

Inferência para Regressão Linear em R

Ver curso

Instruções do exercício

Usando os data frames hypdata_out (contendo um outlier) e hypdata_noout (outlier removido), os data frames perm_slope_out e perm_slope_noout foram criados para conter, respectivamente, as inclinações permutadas dos conjuntos de dados originais. Os valores observados estão armazenados nas variáveis obs_slope_out e obs_slope_noout.

  • Encontre os p-values calculando a proporção de inclinações permutadas cujo valor ( absoluto) é maior ou igual ao valor ( absoluto) das inclinações observadas. Como antes, use mean na desigualdade binária para obter a proporção.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Calculate the p-value with the outlier
perm_slope_out %>% 
  mutate(abs_perm_slope = ___) %>%
  summarize(p_value = ___)

# Calculate the p-value without the outlier
perm_slope_noout %>% 
  mutate(abs_perm_slope = ___) %>%
  summarize(p_value = ___)
Editar e executar o código