1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Vzorkování v R

Connected

cvičení

3 druhy vzorkování

Porovnejme výkon bodových odhadů při použití prostého, stratifikovaného a shlukového vzorkování. Nejdřív si ale připravíme potřebné vzorky.

V těchto cvičeních budeme pracovat se sloupcem RelationshipSatisfaction z datasetu attrition, který kategorizuje vztah zaměstnance ke společnosti. Jde o uspořádaný faktor se čtyřmi úrovněmi: Low, Medium, High a Very_High.

Instrukce 1/3

undefined XP
  • 1

    Proveď prosté náhodné vzorkování na attrition_pop tak, aby výsledný vzorek tvořil čtvrtinu populace.

  • 2

    Proveď stratifikované vzorkování na attrition_pop tak, aby výsledný vzorek tvořil čtvrtinu populace v každé skupině RelationshipSatisfaction. Nezapomeň výsledek seskupení zrušit pomocí ungroup.

  • 3
    • Získej unikátní hodnoty sloupce RelationshipSatisfaction z attrition_pop.
    • Náhodně vyber z satisfaction_unique dvě hodnoty.
    • Proveď shlukové vzorkování na vybraných skupinách spokojenosti, přičemž vezmi čtvrtinu populace a zruš seskupení výsledku.