Influencia
La influencia mide cuánto cambiaría un modelo si se dejara fuera cada observación de los cálculos, una por una. Es decir, mide cómo de diferente se vería la recta de predicción si ajustaras una regresión lineal con todos los puntos menos ese, comparado con ajustarla con todo el conjunto de datos.
La métrica estándar para la influencia es la distancia de Cook, que la calcula en función del tamaño del residuo y del leverage del punto.
Aquí ves el mismo modelo que antes: precio de la vivienda frente a la raíz cuadrada de la distancia a la estación de MRT más cercana en el conjunto de datos de bienes raíces de Taiwán.
Adivina qué observaciones crees que tendrán alta influencia y luego mueve el control deslizante para comprobarlo.
¿Qué afirmación es verdadera?
Este ejercicio forma parte del curso
Introducción a la regresión con statsmodels en Python
ejercicio interactivo práctico
Convierte la teoría en práctica con uno de nuestros ejercicios interactivos
Empezar ejercicio