1. Learn
  2. /
  3. Курси
  4. /
  5. Sampling у Python

Connected

вправа

3 види вибірки

Ви порівняєте ефективність точкових оцінок за простого випадкового, стратифікованого та кластерного відбору. Перш ніж це зробити, потрібно підготувати вибірки.

Ви використаєте стовпець RelationshipSatisfaction з набору даних attrition_pop, який відображає задоволеність працівника взаємодією з компанією. Є чотири рівні: Low, Medium, High і Very_High. pandas завантажено з типовим псевдонімом, а пакет random — підключено.

Інструкції 1/3

undefined XP
  • 1
    • Виконайте просту випадкову вибірку з attrition_pop, щоб отримати чверть сукупності, встановивши зерно випадковості 2022.
  • 2
    • Виконайте стратифіковану вибірку з attrition_pop, щоб відібрати чверть спостережень у кожній групі RelationshipSatisfaction, встановивши зерно випадковості 2022.
  • 3
    • Створіть список унікальних значень зі стовпця RelationshipSatisfaction у attrition_pop.
    • Випадково виберіть із satisfaction_unique два значення.
    • Відібрайте рядки сукупності, де RelationshipSatisfaction належить до satisfaction_samp, і приберіть невикористані категорії зі RelationshipSatisfaction; присвойте до attrition_clust_prep.
    • Виконайте кластерну вибірку на вибраних групах задоволеності, відібравши одну чверть від усієї сукупності та встановивши зерно випадковості 2022.