IniziaInizia gratis

Sostituisci i dati mancanti - II

Come per molte attività di manipolazione di serie temporali, esistono diversi modi per gestire i dati mancanti. Come hai visto nell’esercizio precedente, sia l’approccio locf sia nocb richiedono di fare ipotesi sui pattern di crescita nei tuoi dati. Mentre locf è più conservativo e nocb è più aggressivo, entrambi generano una crescita a gradini a partire da dati mancanti.

Ma se ti aspetti una crescita lineare nei tuoi dati? In questo caso può essere più utile usare l’interpolazione lineare, che genera nuovi valori tra i dati ai due estremi del valore mancante, pesati in base al tempo.

In questo esercizio, riempirai i valori mancanti in gdp_xts usando il comando na.approx(), che utilizza l’interpolazione per stimare valori lineari nel tempo.

Questo esercizio fa parte del corso

Caso di studio: analisi di serie temporali cittadine in R

Visualizza il corso

Istruzioni dell'esercizio

  • Usa na.approx() per riempire i valori mancanti in gdp_xts con l’interpolazione lineare. Salva il nuovo oggetto xts come gdp_approx.
  • Traccia il nuovo oggetto xts usando plot.xts().
  • Interroga il nuovo oggetto xts per il PIL nel 1993.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Fill NAs in gdp_xts using linear approximation
gdp_approx <- 

# Plot your new xts object
plot.xts(___, major.format = "%Y")
  
# Query for GDP in 1993 in gdp_approx
Modifica ed esegui il codice