Regressione lineare con dati incompleti
I dati mancanti sono un problema comune e gestirli correttamente è fondamentale. Ignorare i valori mancanti o riempirli nel modo sbagliato può far funzionare i modelli in modo imprevisto e introdurre bias nelle previsioni e nelle inferenze.
In questo capitolo lavorerai con l'insieme di dati biopics. Contiene informazioni su vari film biografici, tra cui incassi, caratteristiche dei soggetti e altre variabili. Alcuni punti dati, però, sono mancanti. I dati originali provengono dal pacchetto R fivethirtyeight, ma in questo corso userai una versione leggermente preprocessata.
In questo esercizio conoscerai l'insieme di dati e adatterai un modello di regressione lineare per spiegare gli incassi di un film. Iniziamo!
Questo esercizio fa parte del corso
Gestione dei dati mancanti con imputazioni in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print first 10 observations
___(biopics, ___)