Likelihood e log-likelihood
La regressione lineare cerca di ottimizzare una metrica di "somma dei quadrati" per trovare il miglior adattamento. Quella metrica non è applicabile alla regressione logistica. Al suo posto, la regressione logistica cerca di ottimizzare una metrica chiamata likelihood o una metrica correlata chiamata log-likelihood.
Il cruscotto mostra lo stato di churn rispetto al tempo dall’ultimo acquisto dal dataset churn. La linea blu tratteggiata è la linea di previsione della regressione logistica calcolata da geom_smooth() di ggplot2. (Cioè, è la linea di "miglior adattamento".) La linea nera continua mostra una linea di previsione calcolata a partire dai coefficienti di intercetta e pendenza che specifichi come plogis(intercept + slope * time_since_last_purchase).
Modifica i coefficienti di intercetta e pendenza e osserva come cambiano i valori di likelihood e log-likelihood.
Avvicinandoti alla linea di miglior adattamento, quale affermazione è vera su likelihood e log-likelihood?
Questo esercizio fa parte del corso
Regressione intermedia in R
Esercizio pratico interattivo
Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi
Inizia esercizio