IniziaInizia gratis

Regressione lineare con dati incompleti

I dati mancanti sono un problema comune e gestirli correttamente è fondamentale. Ignorare i valori mancanti o riempirli nel modo sbagliato può far funzionare i modelli in modo imprevisto e introdurre bias nelle previsioni e nelle inferenze.

In questo capitolo lavorerai con l'insieme di dati biopics. Contiene informazioni su vari film biografici, tra cui incassi, caratteristiche dei soggetti e altre variabili. Alcuni punti dati, però, sono mancanti. I dati originali provengono dal pacchetto R fivethirtyeight, ma in questo corso userai una versione leggermente preprocessata.

In questo esercizio conoscerai l'insieme di dati e adatterai un modello di regressione lineare per spiegare gli incassi di un film. Iniziamo!

Questo esercizio fa parte del corso

Gestione dei dati mancanti con imputazioni in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Print first 10 observations
___(biopics, ___)
Modifica ed esegui il codice