Sostituisci i dati mancanti - II
Come per molte attività di manipolazione di serie temporali, esistono diversi modi per gestire i dati mancanti. Come hai visto nell’esercizio precedente, sia l’approccio locf sia nocb richiedono di fare ipotesi sui pattern di crescita nei tuoi dati. Mentre locf è più conservativo e nocb è più aggressivo, entrambi generano una crescita a gradini a partire da dati mancanti.
Ma se ti aspetti una crescita lineare nei tuoi dati? In questo caso può essere più utile usare l’interpolazione lineare, che genera nuovi valori tra i dati ai due estremi del valore mancante, pesati in base al tempo.
In questo esercizio, riempirai i valori mancanti in gdp_xts usando il comando na.approx(), che utilizza l’interpolazione per stimare valori lineari nel tempo.
Questo esercizio fa parte del corso
Caso di studio: analisi di serie temporali cittadine in R
Istruzioni dell'esercizio
- Usa
na.approx()per riempire i valori mancanti ingdp_xtscon l’interpolazione lineare. Salva il nuovo oggetto xts comegdp_approx. - Traccia il nuovo oggetto xts usando
plot.xts(). - Interroga il nuovo oggetto xts per il PIL nel 1993.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fill NAs in gdp_xts using linear approximation
gdp_approx <-
# Plot your new xts object
plot.xts(___, major.format = "%Y")
# Query for GDP in 1993 in gdp_approx