1. Учиться
  2. /
  3. Courses
  4. /
  5. Giới thiệu R cho Tài chính

Connected

Exercise

Chia nhóm (bucket) một biến số thành factor

Người bạn cũ Dan gửi cho bạn danh sách 50 trái phiếu được xếp hạng AAA gọi là AAA_rank, với mỗi trái phiếu có thêm một số từ 1–100 mô tả mức lợi nhuận mà anh ấy nghĩ trái phiếu đó sẽ mang lại (100 là lợi nhuận cao nhất). Bạn muốn phân tích sâu hơn các gợi ý của anh ấy, nhưng trước tiên sẽ hữu ích nếu các trái phiếu được chia nhóm theo thứ hạng. Điều này giúp bạn tạo các nhóm trái phiếu, từ lợi nhuận thấp đến cao, để phân tích dễ dàng hơn.

Đây là ví dụ điển hình về việc tạo một factor từ một vector số. Cách dễ nhất là dùng cut(). Bên dưới, thang điểm 1–100 của Dan được chia thành 5 nhóm cách đều nhau. Lưu ý rằng dấu ( trong các mức của factor có nghĩa là chúng ta không bao gồm số đứng cạnh nó trong nhóm đó, còn dấu ] nghĩa là chúng ta có bao gồm số đó trong nhóm.

head(AAA_rank)

[1]  31  48 100  53  85  73

AAA_factor <- cut(x = AAA_rank, breaks = c(0, 20, 40, 60, 80, 100))

head(AAA_factor)

[1] (20,40]  (40,60]  (80,100] (40,60]  (80,100] (60,80] 
Levels: (0,20] (20,40] (40,60] (60,80] (80,100]

Trong hàm cut(), sử dụng breaks = cho phép bạn chỉ định các nhóm mà bạn muốn R chia dữ liệu vào!

Инструкции

100 XP
  • Thay vì 5 nhóm, bạn có thể tạo chỉ 4 nhóm không? Trong breaks = hãy dùng một vector từ 0 đến 100 với mỗi phần tử cách nhau 25 đơn vị. Gán kết quả cho AAA_factor.
  • 4 nhóm hiện chưa có tên mô tả. Dùng levels() để đổi tên các mức thành "low", "medium", "high", và "very_high", theo đúng thứ tự đó.
  • In AAA_factor sau khi đổi tên.
  • Vẽ biểu đồ AAA_factor để trực quan hóa kết quả!