BaşlayınÜcretsiz Başlayın

Eksik verileri değiştir - I

Önceki egzersizde keşfettiğin üzere, üç aylık GSYİH verilerinde birkaç gözlem eksik görünüyor. Hatta, önceki egzersizdeki summary() çağrın 80 adet eksik veri noktası olduğunu ortaya koydu!

İlk xts kursundan hatırlayacağın gibi, xts ve zoo eksik verileri ele almak için çeşitli fonksiyonlar sağlar.

En basit teknik, eksik veriden önceki son gözlemi ileriye taşıyan na.locf() komutudur (bu nedenle "last observation carried forward", yani locf). Bu yaklaşım, özellikle verilerindeki büyüme konusunda temkinli olmak için nedenlerin varsa, eksiklikle başa çıkmanın çoğu zaman en uygun yoludur.

Benzer bir yaklaşım tersi yönde çalışır: eksik değerden sonraki ilk gözlemi alıp geriye taşır ("next observation carried backward", yani nocb). Bu tekniği na.locf() komutunda fromLast argümanını TRUE yaparak da uygulayabilirsin.

Hangi yöntemin en iyisi olduğuna, çalıştığın veri türü ve verinin zaman içindeki değişimine dair önyargıların karar verir.

Bu egzersiz

Vaka Çalışması: R ile Şehir Zaman Serisi Verilerini Analiz Etme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • na.locf() kullanarak gdp_xts içindeki eksik değerleri, son gözlemi ileri taşıma yöntemiyle doldur. Bu yeni xts nesnesini gdp_locf olarak kaydet.
  • na.locf()'u tekrar çağırarak gdp_xts içindeki eksik değerleri, sonraki gözlemi geri taşıyarak doldur. Bunu yapmak için fromLast argümanını TRUE olarak ayarla. Bu yeni xts nesnesini gdp_nocb olarak kaydet.
  • Her iki nesneyi de plot.xts() ile görselleştir. Her iki grafiği birlikte göstermek için, önceden yazılmış par() komutunu dahil et.
  • Her bir nesneyi (gdp_locf ve gdp_nocb) 1993 yılı GSYİH değeri için sorgula.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Fill NAs in gdp_xts with the last observation carried forward
gdp_locf <- 

# Fill NAs in gdp_xts with the next observation carried backward 
gdp_nocb <- 

# Produce a plot for each of your new xts objects
par(mfrow = c(2,1))
plot.xts(___, major.format = "%Y")
plot.xts(___, major.format = "%Y")

# Query for GDP in 1993 in both gdp_locf and gdp_nocb

Kodu Düzenle ve Çalıştır