Eksik verileri değiştir - I
Önceki egzersizde keşfettiğin üzere, üç aylık GSYİH verilerinde birkaç gözlem eksik görünüyor. Hatta, önceki egzersizdeki summary() çağrın 80 adet eksik veri noktası olduğunu ortaya koydu!
İlk xts kursundan hatırlayacağın gibi, xts ve zoo eksik verileri ele almak için çeşitli fonksiyonlar sağlar.
En basit teknik, eksik veriden önceki son gözlemi ileriye taşıyan na.locf() komutudur (bu nedenle "last observation carried forward", yani locf). Bu yaklaşım, özellikle verilerindeki büyüme konusunda temkinli olmak için nedenlerin varsa, eksiklikle başa çıkmanın çoğu zaman en uygun yoludur.
Benzer bir yaklaşım tersi yönde çalışır: eksik değerden sonraki ilk gözlemi alıp geriye taşır ("next observation carried backward", yani nocb). Bu tekniği na.locf() komutunda fromLast argümanını TRUE yaparak da uygulayabilirsin.
Hangi yöntemin en iyisi olduğuna, çalıştığın veri türü ve verinin zaman içindeki değişimine dair önyargıların karar verir.
Bu egzersiz
Vaka Çalışması: R ile Şehir Zaman Serisi Verilerini Analiz Etme
kursunun bir parçasıdırEgzersiz talimatları
na.locf()kullanarakgdp_xtsiçindeki eksik değerleri, son gözlemi ileri taşıma yöntemiyle doldur. Bu yeni xts nesnesinigdp_locfolarak kaydet.na.locf()'u tekrar çağırarakgdp_xtsiçindeki eksik değerleri, sonraki gözlemi geri taşıyarak doldur. Bunu yapmak içinfromLastargümanınıTRUEolarak ayarla. Bu yeni xts nesnesinigdp_nocbolarak kaydet.- Her iki nesneyi de
plot.xts()ile görselleştir. Her iki grafiği birlikte göstermek için, önceden yazılmışpar()komutunu dahil et. - Her bir nesneyi (
gdp_locfvegdp_nocb) 1993 yılı GSYİH değeri için sorgula.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Fill NAs in gdp_xts with the last observation carried forward
gdp_locf <-
# Fill NAs in gdp_xts with the next observation carried backward
gdp_nocb <-
# Produce a plot for each of your new xts objects
par(mfrow = c(2,1))
plot.xts(___, major.format = "%Y")
plot.xts(___, major.format = "%Y")
# Query for GDP in 1993 in both gdp_locf and gdp_nocb