MulaiMulai sekarang secara gratis

Menghapus data hilang

Sebelumnya Anda melihat bahwa suku bunga (int_rate) dalam himpunan data loan_data bergantung pada pelanggan. Sayangnya beberapa observasi tidak memiliki suku bunga. Sekarang Anda perlu mengidentifikasi berapa banyak suku bunga yang hilang lalu menghapusnya.

Dalam latihan ini Anda akan menggunakan fungsi which() untuk membuat indeks baris yang berisi NA. Anda kemudian akan menggunakan indeks ini untuk menghapus baris dengan NA.

Latihan ini adalah bagian dari kursus

Pemodelan Risiko Kredit di R

Lihat Kursus

Petunjuk latihan

  • Lihat jumlah masukan yang hilang untuk variabel int_rate menggunakan summary().
  • Gunakan which() dan is.na() untuk membuat indeks observasi yang tidak memiliki suku bunga tercatat. Simpan hasilnya dalam objek na_index.
  • Buat himpunan data baru bernama loan_data_delrow_na, yang tidak memuat observasi dengan suku bunga hilang.
  • Ingat bahwa kita telah membuat salinan loan_data bernama loan_data_delcol_na. Alih-alih menghapus observasi dengan suku bunga hilang, hapus seluruh kolom int_rate dengan menetapkannya sama dengan NULL.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Look at summary of loan_data


# Get indices of missing interest rates: na_index
na_index <- 

# Remove observations with missing interest rates: loan_data_delrow_na
___ <- loan_data[-___, ]

# Make copy of loan_data
loan_data_delcol_na <- loan_data

# Delete interest rate column from loan_data_delcol_na
Edit dan Jalankan Kode