1. Învăţa
  2. /
  3. Courses
  4. /
  5. Mô hình hóa rủi ro tín dụng bằng R

Connected

exercise

Xóa dữ liệu bị thiếu

Bạn đã thấy trước đó rằng lãi suất (int_rate) trong bộ dữ liệu loan_data phụ thuộc vào khách hàng. Đáng tiếc là một số quan sát bị thiếu lãi suất. Giờ bạn cần xác định có bao nhiêu lãi suất bị thiếu và sau đó xóa chúng.

Trong bài tập này, bạn sẽ dùng hàm which() để tạo một chỉ mục các hàng chứa NA. Sau đó bạn sẽ dùng chỉ mục này để xóa các hàng có NA.

Instrucţiuni

100 XP
  • Xem số lượng giá trị bị thiếu của biến int_rate bằng summary().
  • Dùng which() và is.na() để tạo chỉ mục các quan sát không có lãi suất được ghi nhận. Lưu kết quả vào đối tượng na_index.
  • Tạo một bộ dữ liệu mới tên loan_data_delrow_na, không chứa các quan sát có lãi suất bị thiếu.
  • Nhớ rằng chúng ta đã tạo một bản sao của loan_data tên loan_data_delcol_na. Thay vì xóa các quan sát có lãi suất bị thiếu, hãy xóa toàn bộ cột int_rate bằng cách gán nó bằng NULL.