1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lấy mẫu trong Python

Connected

Bài tập

3 kiểu lấy mẫu

Bạn sẽ so sánh hiệu quả của các ước lượng điểm khi dùng lấy mẫu ngẫu nhiên đơn giản, phân tầng và theo cụm. Trước khi làm điều đó, bạn cần thiết lập các mẫu.

Bạn sẽ dùng cột RelationshipSatisfaction của tập dữ liệu attrition_pop, cột này phân loại mức độ hài lòng của nhân viên với công ty. Nó có bốn mức: Low, Medium, High, và Very_High. pandas đã được nạp với bí danh quen thuộc, và gói random cũng đã được nạp.

Hướng dẫn 1/3

undefined XP
  • 1
    • Thực hiện lấy mẫu ngẫu nhiên đơn giản trên attrition_pop để lấy một phần tư quần thể, đặt seed là 2022.
  • 2
    • Thực hiện lấy mẫu phân tầng trên attrition_pop để lấy một phần tư từ mỗi nhóm RelationshipSatisfaction, đặt seed là 2022.
  • 3
    • Tạo danh sách các giá trị duy nhất từ cột RelationshipSatisfaction của attrition_pop.
    • Lấy mẫu ngẫu nhiên satisfaction_unique để chọn hai giá trị.
    • Lọc quần thể cho các hàng có RelationshipSatisfaction nằm trong satisfaction_samp và xóa mọi danh mục không dùng khỏi RelationshipSatisfaction; gán cho attrition_clust_prep.
    • Thực hiện lấy mẫu theo cụm trên các nhóm mức độ hài lòng đã chọn, lấy mẫu một phần tư của quần thể và đặt seed là 2022.