MulaiMulai sekarang secara gratis

Ganti data hilang - I

Seperti yang Anda temukan pada latihan sebelumnya, data PDB triwulanan Anda tampaknya kehilangan beberapa observasi. Bahkan, pemanggilan summary() pada latihan sebelumnya menunjukkan ada 80 titik data yang hilang!

Seperti yang mungkin Anda ingat dari kursus xts pertama, xts dan zoo menyediakan berbagai fungsi untuk menangani data hilang.

Teknik paling sederhana adalah perintah na.locf(), yang meneruskan nilai observasi terakhir sebelum data hilang (itulah sebabnya disebut "last observation carried forward", atau locf). Pendekatan ini sering kali merupakan cara yang paling tepat untuk menangani kekosongan data, khususnya ketika Anda memiliki alasan untuk bersikap konservatif terhadap pertumbuhan dalam data Anda.

Pendekatan serupa bekerja ke arah sebaliknya dengan mengambil observasi pertama setelah nilai yang hilang dan membawanya mundur ("next observation carried backward", atau nocb). Teknik ini juga dapat dilakukan menggunakan perintah na.locf() dengan mengatur argumen fromLast ke TRUE.

Metode mana yang terbaik bergantung pada jenis data yang Anda gunakan dan praduga Anda tentang bagaimana data berubah dari waktu ke waktu.

Latihan ini adalah bagian dari kursus

Studi Kasus: Menganalisis Data Deret Waktu Kota di R

Lihat Kursus

Petunjuk latihan

  • Gunakan na.locf() untuk mengisi nilai yang hilang pada gdp_xts berdasarkan observasi terakhir yang diteruskan ke depan. Simpan objek xts baru ini sebagai gdp_locf.
  • Gunakan pemanggilan lain ke na.locf() untuk mengisi nilai yang hilang pada gdp_xts berdasarkan observasi berikutnya yang dibawa mundur. Untuk melakukannya, atur argumen fromLast ke TRUE. Simpan objek xts baru ini sebagai gdp_nocb.
  • Plot masing-masing objek ini menggunakan plot.xts(). Sertakan perintah par() yang sudah ditulis untuk menampilkan kedua plot secara berdampingan.
  • Ambil nilai PDB untuk tahun 1993 dari masing-masing objek (gdp_locf dan gdp_nocb).

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Fill NAs in gdp_xts with the last observation carried forward
gdp_locf <- 

# Fill NAs in gdp_xts with the next observation carried backward 
gdp_nocb <- 

# Produce a plot for each of your new xts objects
par(mfrow = c(2,1))
plot.xts(___, major.format = "%Y")
plot.xts(___, major.format = "%Y")

# Query for GDP in 1993 in both gdp_locf and gdp_nocb

Edit dan Jalankan Kode