1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa rủi ro tín dụng bằng R

Connected

Bài tập

Biểu đồ tần suất (Histogram)

Bộ dữ liệu loan_data đã được nạp vào không gian làm việc của bạn. Trước đó, bạn đã khám phá các biến phân loại bằng hàm CrossTable(). Giờ bạn muốn khám phá các biến liên tục để xác định các giá trị ngoại lai tiềm ẩn hoặc cấu trúc dữ liệu bất ngờ.

Để làm điều này, hãy thử nghiệm với hàm hist() để hiểu phân phối số tiền vay của các khách hàng khác nhau.

Hướng dẫn

100 XP
  • Dùng hist() để tạo một biểu đồ tần suất với đúng một đối số: loan_data$loan_amnt. Gán kết quả cho một đối tượng mới tên là hist_1.
  • Dùng $breaks cùng với đối tượng hist_1 để lấy thêm thông tin về các khoảng chia (breaks) của biểu đồ. Biết vị trí các khoảng chia rất quan trọng vì nếu chọn không hợp lý, biểu đồ có thể gây hiểu nhầm.
  • Thay đổi số lượng breaks trong hist_1 thành 200 bằng cách chỉ định đối số breaks. Đồng thời, đặt tên trục x là "Loan amount" bằng đối số xlab và tiêu đề là "Histogram of the loan amount" bằng đối số main. Lưu kết quả vào hist_2. Vì sao các đỉnh lại xuất hiện tại những vị trí đó?