ComenzarEmpieza gratis

Influencia

La influencia mide cuánto cambiaría un modelo si se dejara fuera cada observación de los cálculos del modelo, una a una. Es decir, mide cuán diferente se vería la recta de predicción si ejecutaras una regresión lineal con todos los puntos excepto ese, en comparación con ejecutar la regresión lineal con todo el conjunto de datos.

La métrica estándar para la influencia es la distancia de Cook, que calcula la influencia en función del tamaño del residuo y la palanca (leverage) del punto.

Aquí tienes el mismo modelo que antes: precio de la vivienda frente a la raíz cuadrada de la distancia a la estación de MRT más cercana en el conjunto de datos de bienes raíces de Taiwán.

Adivina qué observaciones crees que tendrán alta influencia y luego mueve el control deslizante para comprobarlo.

¿Cuál de las siguientes afirmaciones es verdadera?

Este ejercicio forma parte del curso

Introducción a la regresión con statsmodels en Python

Ver curso

Ejercicio interactivo práctico

Pon en práctica la teoría con uno de nuestros ejercicios interactivos

Empezar ejercicio