Ganti data hilang - I
Seperti yang Anda temukan pada latihan sebelumnya, data PDB triwulanan Anda tampaknya kehilangan beberapa observasi. Bahkan, pemanggilan summary() pada latihan sebelumnya menunjukkan ada 80 titik data yang hilang!
Seperti yang mungkin Anda ingat dari kursus xts pertama, xts dan zoo menyediakan berbagai fungsi untuk menangani data hilang.
Teknik paling sederhana adalah perintah na.locf(), yang meneruskan nilai observasi terakhir sebelum data hilang (itulah sebabnya disebut "last observation carried forward", atau locf). Pendekatan ini sering kali merupakan cara yang paling tepat untuk menangani kekosongan data, khususnya ketika Anda memiliki alasan untuk bersikap konservatif terhadap pertumbuhan dalam data Anda.
Pendekatan serupa bekerja ke arah sebaliknya dengan mengambil observasi pertama setelah nilai yang hilang dan membawanya mundur ("next observation carried backward", atau nocb). Teknik ini juga dapat dilakukan menggunakan perintah na.locf() dengan mengatur argumen fromLast ke TRUE.
Metode mana yang terbaik bergantung pada jenis data yang Anda gunakan dan praduga Anda tentang bagaimana data berubah dari waktu ke waktu.
Latihan ini adalah bagian dari kursus
Studi Kasus: Menganalisis Data Deret Waktu Kota di R
Petunjuk latihan
- Gunakan
na.locf()untuk mengisi nilai yang hilang padagdp_xtsberdasarkan observasi terakhir yang diteruskan ke depan. Simpan objek xts baru ini sebagaigdp_locf. - Gunakan pemanggilan lain ke
na.locf()untuk mengisi nilai yang hilang padagdp_xtsberdasarkan observasi berikutnya yang dibawa mundur. Untuk melakukannya, atur argumenfromLastkeTRUE. Simpan objek xts baru ini sebagaigdp_nocb. - Plot masing-masing objek ini menggunakan
plot.xts(). Sertakan perintahpar()yang sudah ditulis untuk menampilkan kedua plot secara berdampingan. - Ambil nilai PDB untuk tahun 1993 dari masing-masing objek (
gdp_locfdangdp_nocb).
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Fill NAs in gdp_xts with the last observation carried forward
gdp_locf <-
# Fill NAs in gdp_xts with the next observation carried backward
gdp_nocb <-
# Produce a plot for each of your new xts objects
par(mfrow = c(2,1))
plot.xts(___, major.format = "%Y")
plot.xts(___, major.format = "%Y")
# Query for GDP in 1993 in both gdp_locf and gdp_nocb