Inferência com e sem outlier (randomização)
Usando o teste por randomização, você pode novamente avaliar o efeito de um outlier nas conclusões inferenciais de um modelo linear. Execute um teste de randomização nos dados hypdata_out duas vezes: uma com o valor discrepante e outra sem ele. Observe que as linhas de código estendidas deixam claros os passos dos testes de randomização.
Este exercício faz parte do curso
Inferência para Regressão Linear em R
Instruções do exercício
Usando os data frames hypdata_out (contendo um outlier) e hypdata_noout (outlier removido), os data frames perm_slope_out e perm_slope_noout foram criados para conter, respectivamente, as inclinações permutadas dos conjuntos de dados originais. Os valores observados estão armazenados nas variáveis obs_slope_out e obs_slope_noout.
- Encontre os p-values calculando a proporção de inclinações permutadas cujo valor (
absoluto) é maior ou igual ao valor (absoluto) das inclinações observadas. Como antes, usemeanna desigualdade binária para obter a proporção.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate the p-value with the outlier
perm_slope_out %>%
mutate(abs_perm_slope = ___) %>%
summarize(p_value = ___)
# Calculate the p-value without the outlier
perm_slope_noout %>%
mutate(abs_perm_slope = ___) %>%
summarize(p_value = ___)