1. Learn
  2. /
  3. Cursuri
  4. /
  5. Eșantionare în Python

Connected

exercițiu

3 tipuri de eșantionare

Vei compara performanța estimărilor punctuale folosind eșantionarea simplă, stratificată și prin clustere. Înainte de asta, va trebui să pregătești eșantioanele.

Vei folosi coloana RelationshipSatisfaction din setul de date attrition_pop, care clasifică relația angajatului cu compania. Are patru niveluri: Low, Medium, High și Very_High. pandas a fost importat cu aliasul său obișnuit, iar pachetul random a fost de asemenea importat.

Instrucțiuni 1/3

undefined XP
  • 1
    • Realizează eșantionarea aleatoare simplă pe attrition_pop pentru a obține un sfert din populație, setând seed-ul la 2022.
  • 2
    • Realizează eșantionarea stratificată pe attrition_pop pentru a eșantiona un sfert din fiecare grup RelationshipSatisfaction, setând seed-ul la 2022.
  • 3
    • Creează o listă cu valorile unice din coloana RelationshipSatisfaction a lui attrition_pop.
    • Eșantionează aleator satisfaction_unique pentru a obține două valori.
    • Filtrează populația pentru rândurile în care RelationshipSatisfaction se află în satisfaction_samp și elimină categoriile neutilizate din RelationshipSatisfaction; atribuie rezultatul variabilei attrition_clust_prep.
    • Realizează eșantionarea prin clustere pe grupurile de satisfacție selectate, eșantionând un sfert din populație și setând seed-ul la 2022.