Influência
A influência mede o quanto um modelo seria alterado se cada observação fosse deixada de fora dos cálculos do modelo, uma de cada vez. Ou seja, ele mede a diferença que a linha de previsão teria se você executasse uma regressão linear em todos os pontos de dados, exceto aquele ponto, em comparação com a execução de uma regressão linear em todo o conjunto de dados.
A métrica padrão para influência é a distância de Cook, que calcula a influência com base no tamanho do resíduo e na alavancagem do ponto.
Aqui você pode ver o mesmo modelo da última vez: preço da casa versus a raiz quadrada da distância da estação MRT mais próxima no conjunto de dados imobiliários de Taiwan.
Adivinhe quais observações você acha que terão uma grande influência e, em seguida, mova o controle deslizante para descobrir.
Qual afirmação é verdadeira?
Este exercício faz parte do curso
Introdução à regressão em R
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
