1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Vzorkování v Pythonu

Connected

cvičení

Je systematické vzorkování v pořádku?

Systematické vzorkování má jeden háček: pokud jsou data seřazená nebo pořadí řádků nějak závisí na hodnotách, výsledný vzorek nemusí reprezentovat celou populaci. Řešením je náhodné přeuspořádání řádků – jenže pak je systematické vzorkování v podstatě totéž co prosté náhodné vzorkování.

Tady se podíváš na to, jak poznat, jestli takový problém nastává.

K dispozici máš attrition_pop; pandas je načtený jako pd a matplotlib.pyplot jako plt.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Přidej do attrition_pop sloupec s indexem a výsledek ulož do attrition_pop_id.
  • Pomocí pandas .plot() vytvoř bodový graf YearsAtCompany v závislosti na index pro attrition_pop_id.