1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân cụm bằng R

Connected

Bài tập

Khám phá dữ liệu ban đầu

Bạn được cung cấp dữ liệu từ chương trình Occupational Employment Statistics (OES), chương trình này hằng năm tạo ra các ước tính về việc làm và tiền lương. Bộ dữ liệu này chứa thu nhập trung bình theo năm từ 2001 đến 2016 cho 22 nhóm nghề nghiệp. Bạn muốn dùng dữ liệu này để xác định các cụm nghề có xu hướng thu nhập tương đồng.

Dữ liệu đã được lưu trong môi trường của bạn dưới dạng ma trận dữ liệu oes.

Trước khi bắt đầu phân cụm dữ liệu này, bạn nên xác định xem có cần các bước tiền xử lý nào (như chuẩn hóa/scale hay bù khuyết giá trị) hay không.

Hãy dùng các hàm head() và summary() để khám phá dữ liệu oes nhằm quyết định những bước tiền xử lý nào dưới đây là cần thiết:

Hướng dẫn

50 XP

Các phương án trả lời