Influência
A influência mede o quanto um modelo mudaria se cada observação fosse deixada de fora dos cálculos do modelo, uma de cada vez. Ou seja, mede quão diferente ficaria a linha de previsão se você executasse uma regressão linear em todos os pontos de dados exceto aquele ponto, em comparação com executar uma regressão linear em todo o conjunto de dados.
A métrica padrão para influência é a distância de Cook, que calcula a influência com base no tamanho do resíduo e na alavancagem do ponto.
Você pode ver o mesmo modelo da última vez: preço da casa versus a raiz quadrada da distância até a estação de MRT mais próxima no conjunto de dados de imóveis de Taiwan.
Tente adivinhar quais observações você acha que terão alta influência e, em seguida, mova o controle deslizante para descobrir.
Qual afirmação é verdadeira?
Este exercicio faz parte do curso
Introdução à Regressão com statsmodels em Python
exercicio interativo prático
Transforme teoria em prática com um dos nossos exercicio interativos
Iniciar exercicio