Menghapus data hilang
Sebelumnya Anda melihat bahwa suku bunga (int_rate) dalam himpunan data loan_data bergantung pada pelanggan. Sayangnya beberapa observasi tidak memiliki suku bunga. Sekarang Anda perlu mengidentifikasi berapa banyak suku bunga yang hilang lalu menghapusnya.
Dalam latihan ini Anda akan menggunakan fungsi which() untuk membuat indeks baris yang berisi NA. Anda kemudian akan menggunakan indeks ini untuk menghapus baris dengan NA.
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit di R
Petunjuk latihan
- Lihat jumlah masukan yang hilang untuk variabel
int_ratemenggunakan summary(). - Gunakan
which()danis.na()untuk membuat indeks observasi yang tidak memiliki suku bunga tercatat. Simpan hasilnya dalam objekna_index. - Buat himpunan data baru bernama
loan_data_delrow_na, yang tidak memuat observasi dengan suku bunga hilang. - Ingat bahwa kita telah membuat salinan
loan_databernamaloan_data_delcol_na. Alih-alih menghapus observasi dengan suku bunga hilang, hapus seluruh kolomint_ratedengan menetapkannya sama denganNULL.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Look at summary of loan_data
# Get indices of missing interest rates: na_index
na_index <-
# Remove observations with missing interest rates: loan_data_delrow_na
___ <- loan_data[-___, ]
# Make copy of loan_data
loan_data_delcol_na <- loan_data
# Delete interest rate column from loan_data_delcol_na