Influenza
L'influenza misura quanto cambierebbe un modello se ciascuna osservazione venisse esclusa dai calcoli, una alla volta. In altre parole, misura quanto sarebbe diversa la retta di previsione se eseguissi una regressione lineare su tutti i punti tranne quello, rispetto a eseguire la regressione sull'intero insieme di dati.
La metrica standard per l'influenza è la distanza di Cook, che la calcola in base alla dimensione del residuo e alla leva del punto.
Qui vedi lo stesso modello di prima: prezzo delle case in funzione della radice quadrata della distanza dalla stazione MRT più vicina, nel dataset immobiliare di Taiwan.
Prova a indovinare quali osservazioni potrebbero avere un'alta influenza, poi sposta lo slider per scoprirlo.
Quale affermazione è vera?
Questo esercizio fa parte del corso
Introduzione alla regressione con statsmodels in Python
esercizio interattivo pratico
Trasforma la teoria in pratica con uno dei nostri esercizi interattivi
Inizia esercizio